TF-IDF(term frequency–inverse document frequency)词频--反转文件频率,是一种用于情报检索与文本挖掘的常用加权技术,用以评估一个词对于一个文件或者一个语料库中的一个领域文件集的重要程度。
词(詞) cí(ㄘˊ)
(一)、语言里最小的可以独立运用的单位:词汇。词书。词典。词句。词序。词组。
(二)、言辞,话语,泛指写诗作文:歌词。演讲词。誓词。词章。词律(文词的声律)。
(三)、中国一种诗体(起于南朝,形成于唐代,盛行于宋代。本可入乐歌唱,后乐谱失传,只按词牌格律创作):词人。词谱。词牌。词调( diào )。词韵。词曲。
频(頻) pín(ㄆ一ㄣˊ)
(一)、屡次,连次:频繁。频仍。频数( shù )(次数多而接连)。频率( lǜ )。频谱。捷报频传。
(二)、危急:“国步斯频”。
(三)、并列:“百嘉备舍,群神频行”。
(四)、古同“颦”。