首页 > 试题广场 >

在包含N 个文档的语料库中,随机选择一个文档。该文件总共包含

[单选题]

在包含N 个文档的语料库中,随机选择一个文档。该文件总共包含 T 个词,词条「数据」出现 K 次。如果词条「数据」出现在文件总数的数量接近三分之一,则 TF(词频)和 IDF(逆文档频率)的乘积的正确值是多少?()

  • KT * Log(3)

  • K * Log(3) / T

  • T * Log(3) / K

  • Log(3) / KT

这道题你会答吗?花几分钟告诉大家答案吧!