矩阵: 行为doc, 列为word, 构成一个矩阵A n * m. n个doc,m个word
NMF: A(nm) = B(nq) * C(qm)
其中:
B称作权重矩阵, 每行为一个doc, 每列为一个特征;【行就是该doc有哪些特征构成, 特征权重是多少】
C称作特征矩阵, 每行为一个特征,每列为一个word; 【行就是该特征由哪些word构成以及word的权重】
通常q << n, 达到降维的目的
tf-idf, 可以达到特征选择的目的, 同时也可以得到doc中特征的权重
时间:2024-06-28 15:27:22
矩阵: 行为doc, 列为word, 构成一个矩阵A n * m. n个doc,m个word
NMF: A(nm) = B(nq) * C(qm)
其中:
B称作权重矩阵, 每行为一个doc, 每列为一个特征;【行就是该doc有哪些特征构成, 特征权重是多少】
C称作特征矩阵, 每行为一个特征,每列为一个word; 【行就是该特征由哪些word构成以及word的权重】
通常q << n, 达到降维的目的
tf-idf, 可以达到特征选择的目的, 同时也可以得到doc中特征的权重