基于混合模型的无监督文本分类研究
摘要随着互联网的不断深入发展,网络上堆积的数据量日益庞大,并且大部分数据以文本的形式存储。文本的非数值性、复杂性等非结构性特点,使得文本挖掘成为数据挖掘相关领域中的热点与难点。无监督的文本分类是文本自动分类的一个重要研究领域。由于无监督的文本分类不需要预先对文档手工标注类别,具有灵活性和自动化的特点,目前已经成为对文本信息进行处理的重要手段。在对传统文本挖掘方法和过程仔细分析的基础上,本文对基于混合模型的文本挖掘方法进行了研究和实验。在文本挖掘的词袋模型中,一般将每个文档的词频向量作为基本的分析对象。本文认为文本集合中所包含的各种主题的词频分布,比每个文档的词频分布更本质、更稳定、也更实用。所...
相关推荐
-
10KV电网D-SCADA 系统信息采集与故障诊断研究与设计VIP免费
2024-10-14 59 -
方形吸顶散流器平送风等温射流特性研究VIP免费
2025-01-09 23 -
关于充液声导波传感器中频散兰姆波的研究VIP免费
2025-01-09 38 -
结合梁斜拉桥施工过程中考虑剪力滞影响的分析方法VIP免费
2025-01-09 50 -
空调房间热舒适性的数值模拟与实验研究VIP免费
2025-01-09 24 -
汽车前轮线控转向系统研究VIP免费
2025-01-09 36 -
输入分配型混合动力车辆动力系统控制策略研究VIP免费
2025-01-09 20 -
双馈风力发电系统的柔性并网控制研VIP免费
2025-01-09 52 -
污水处理厂污泥好氧堆肥发酵技术的试验研究VIP免费
2025-01-09 23 -
应用风室试验装置的风机性能VIP免费
2025-01-09 22
相关内容
-
汽车前轮线控转向系统研究
分类:高等教育资料
时间:2025-01-09
标签:无
格式:PDF
价格:15 积分
-
输入分配型混合动力车辆动力系统控制策略研究
分类:高等教育资料
时间:2025-01-09
标签:无
格式:PDF
价格:15 积分
-
双馈风力发电系统的柔性并网控制研
分类:高等教育资料
时间:2025-01-09
标签:无
格式:PDF
价格:15 积分
-
污水处理厂污泥好氧堆肥发酵技术的试验研究
分类:高等教育资料
时间:2025-01-09
标签:无
格式:PDF
价格:15 积分
-
应用风室试验装置的风机性能
分类:高等教育资料
时间:2025-01-09
标签:无
格式:PDF
价格:15 积分

