文本分类作为数据挖掘领域的经典问题,在工程上应用广泛,其中新闻分类即是一种重要的应用场景。互联网上的新闻主要分为体育,军事,娱乐,旅游,汽车,社会,科技,财经等八大类,本题提供了部分新闻分类的训练数据和测试数据,请对测试数据中每一篇新闻按这八大类进行划分。
数据获取
压缩包内包含news_train.csv和news_test.csv两个文件。
news_train.csv:新闻分类的训练数据,每行通过 分为两列,第一列为新闻所属类别,第二列为新闻内容,总共16000行。
news_test.csv:测试数据,每行表示一篇新闻内容,总共8000行。
结果文件上传
对测试数据的每一篇新闻进行分类,输出8000行文件a.txt,文件格式请参考压缩包内的sample_a.txt。