期刊文献+
共找到226篇文章
< 1 2 12 >
每页显示 20 50 100
Towards text-theme from appraisal theory: A functional approach to Pearl Harbor address to the nation
1
作者 WU An-ping 《Sino-US English Teaching》 2008年第11期30-36,共7页
Text-theme, the writing or speaking motive, is construed before creation at the basis of a writer's or speaker's background and typical cognitive structures. This paper attempts to explore text-theme in the Pearl Ha... Text-theme, the writing or speaking motive, is construed before creation at the basis of a writer's or speaker's background and typical cognitive structures. This paper attempts to explore text-theme in the Pearl Harbor address to the nation within the framework of appraisal theory founded by James Martin, et al., the excavation is centered on how the grammatical resources of appraisal can disclose the addressor's evaluation of the text-theme. The aim for the study is to testify the operationality and practicability of appraisal theory towards the exploration on text analysis. It is hoped that the theoretical and practical significance in the present exploration of text-theme can provide inspirations and novel insights in the realm of English language teaching and text analysis. 展开更多
关键词 text-theme attitude ADDRESS
下载PDF
基于网络文本数据的主题餐厅服务场景分析 被引量:1
2
作者 胡保玲 白雪 《四川旅游学院学报》 2024年第2期10-16,共7页
以大众点评的评分为标准,借助Python网络爬虫,爬取青岛市主题餐厅的线上评论,通过文本分析和扎根理论分析主题餐厅服务场景的具体维度。结果表明:(1)主题餐厅服务场景包括物理服务场景、社会互动服务场景和文化服务场景,主题餐厅物理服... 以大众点评的评分为标准,借助Python网络爬虫,爬取青岛市主题餐厅的线上评论,通过文本分析和扎根理论分析主题餐厅服务场景的具体维度。结果表明:(1)主题餐厅服务场景包括物理服务场景、社会互动服务场景和文化服务场景,主题餐厅物理服务场景包含设施设备、就餐环境、经营方法和菜肴品质;主题餐厅社会互动服务场景包含社会交往;主题餐厅文化服务场景包含文化建设。(2)主题餐厅物理服务场景、社会互动服务场景和文化服务场景在金字塔模型中处于由低到高的层级关系。物理服务场景是主题餐厅服务场景的基础;社会互动服务场景是主题餐厅服务场景的重要组成部分;文化服务场景是主题餐厅的高阶服务场景,是主题餐厅服务场景的核心。 展开更多
关键词 主题餐厅 服务场景 文本分析 扎根理论
下载PDF
河南省创新政策的结构特征:主题、主体与网络图谱
3
作者 丁云霞 《河南科技》 2024年第9期147-152,共6页
【目的】为持续推动自主创新体系建设,河南省政府在“十三五”时期出台了一系列促进创新发展的政策措施,对其进行分析能够明晰创新政策制定的现状,为后续改进提供参考。【方法】运用计量分析和社会网络分析软件,对河南省“十三五”期间... 【目的】为持续推动自主创新体系建设,河南省政府在“十三五”时期出台了一系列促进创新发展的政策措施,对其进行分析能够明晰创新政策制定的现状,为后续改进提供参考。【方法】运用计量分析和社会网络分析软件,对河南省“十三五”期间发布的437件创新政策文本进行梳理,对政策的发文时间和数量、政策主题、发文主体等相关特征值进行描述,并绘制创新政策关键词网络图谱、发文主体的合作网络图谱。【结果】河南省创新政策发文量与河南省创新发展需求基本协调,但存在发文主题广泛、缺乏融会贯通、发文主体责任不明确及协同性有待增强等问题。【结论】河南省须加强创新政策内容整合、明确主体责任、加强发文主体合作,为持续推进创新发展提供政策力量。 展开更多
关键词 创新政策 政策文本 政策主题 发文主体 网络图谱
下载PDF
基于文本分析的主题公园游客感知研究——以深圳欢乐谷为例
4
作者 祁黄雄 黄梦丹 +2 位作者 周训娥 武易德 张雨丹 《测绘与空间地理信息》 2024年第9期12-15,共4页
以深圳欢乐谷作为研究对象,基于网络文本分析法,采集携程和美团两大平台中深圳欢乐谷的游客评论,利用ROST CM6词频分析软件对结果进行分析整理,同时运用GooSeeker文本分析软件进行整体评价分析、高频词分析及情感分析。结合深圳欢乐谷... 以深圳欢乐谷作为研究对象,基于网络文本分析法,采集携程和美团两大平台中深圳欢乐谷的游客评论,利用ROST CM6词频分析软件对结果进行分析整理,同时运用GooSeeker文本分析软件进行整体评价分析、高频词分析及情感分析。结合深圳欢乐谷主题公园特有的业态属性,深入探讨游客在游玩过程中的情感、需求和满意程度,找出当前深圳欢乐谷旅游服务存在的问题,并提出改进意见,为深圳欢乐谷及同类型主题公园的旅游发展提供参考。 展开更多
关键词 主题公园 网络文本分析 游客满意度
下载PDF
多视图融合DJ-TextRCNN的古籍文本主题推荐研究 被引量:1
5
作者 武帅 杨秀璋 何琳 《情报学报》 CSSCI CSCD 北大核心 2024年第1期61-75,共15页
传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此,本文结合古籍语料特征探究如何实现精准推荐符合研究者需... 传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此,本文结合古籍语料特征探究如何实现精准推荐符合研究者需求的文本主题内容的方法,以推动数字人文研究的进一步发展。首先,选取本课题组前期标注的古籍语料数据进行主题类别标注和视图分类;其次,构建融合BERT(bidirectional encoder representation from transformers)预训练模型、改进卷积神经网络、循环神经网络和多头注意力机制的语义挖掘模型;最后,融入“主体-关系-客体”多视图的语义增强模型,构建DJ-TextRCNN(DianJi-recurrent convolutional neural networks for text classification)模型实现对典籍文本更细粒度、更深层次、更多维度的语义挖掘。研究结果发现,DJ-TextRCNN模型在不同视图下的古籍主题推荐任务的准确率均为最优。在“主体-关系-客体”视图下,精确率达到88.54%,初步实现了对古籍文本的精准主题推荐,对中华文化深层次、细粒度的语义挖掘具有一定的指导意义。 展开更多
关键词 数字人文 古籍文本 主题推荐 多视图融合 DJ-TextRCNN
下载PDF
跨界颠覆性创新的早期识别方法及实证检验 被引量:1
6
作者 田红云 王铭瑟 田丰 《情报杂志》 CSSCI 北大核心 2024年第5期87-96,105,共11页
[研究目的]数字经济时代,越来越多的企业利用互联网技术开展跨界颠覆性创新。探讨跨界颠覆性创新的早期判断和识别方法,对于打破国外核心技术封锁,抢占科技制高点具有重大意义。[研究方法]根据跨界颠覆性创新的演进特点,从技术和市场两... [研究目的]数字经济时代,越来越多的企业利用互联网技术开展跨界颠覆性创新。探讨跨界颠覆性创新的早期判断和识别方法,对于打破国外核心技术封锁,抢占科技制高点具有重大意义。[研究方法]根据跨界颠覆性创新的演进特点,从技术和市场两个方面提出识别跨界颠覆性创新的理论框架:首先,基于专利文本,利用LDA主题模型提取跨界技术主题;其次,从成长性、融合性、影响力和引用行业外新知识等四个特征考察技术主题跨界颠覆的技术潜力;最后,基于专利、用户和专家评论数据,借助LDA主题模型与情感分析方法,从易扩散性、需求贴合度与市场吸引力趋势等特征考察技术主题跨界颠覆的市场潜力。[研究结论]以手机定位与导航技术为例,通过考察其跨界颠覆的技术潜力特征和市场潜力特征,验证了跨界颠覆性技术早期识别方法的可用性与有效性,为企业跨界颠覆性创新实践提供借鉴。 展开更多
关键词 跨界颠覆性创新 跨界技术主题 市场颠覆性特征 技术颠覆性特征 专利文本 手机导航 LDA 早期识别方法
下载PDF
基于LDA主题模型的服务业企业创新测度研究——兼与传统创新测度方法的对比分析
7
作者 冯晓华 顾金科 《科学管理研究》 CSSCI 北大核心 2024年第3期76-88,共13页
服务创新是新时代服务业高质量发展的重要内涵。以R&D投入、专利申请为代表的传统创新测度方法在衡量服务业企业创新时存在明显缺陷。使用隐含狄利克雷分配(LDA)主题模型对2008-2022年间914家服务业上市公司的创新水平进行了测度,... 服务创新是新时代服务业高质量发展的重要内涵。以R&D投入、专利申请为代表的传统创新测度方法在衡量服务业企业创新时存在明显缺陷。使用隐含狄利克雷分配(LDA)主题模型对2008-2022年间914家服务业上市公司的创新水平进行了测度,并从企业整体、行业归属、区域分布、企业规模、企业所有制维度与传统创新测度方法对比分析。研究发现:相较于传统创新测度方法,LDA方法能够①同时反映服务业企业创新中的技术和非技术创新部分,更适用于测度非研发和非专利服务业企业;②更好捕捉教育,文化、体育和娱乐业等生活性服务业企业的创新特征和形式;③向上纠偏中西部地区服务业企业创新水平,向下纠偏东部地区服务业企业创新水平,还原东部和中西部地区服务业企业真实创新差距;④向上纠偏中小型服务业企业创新水平,向下纠偏大型服务业企业创新水平;⑤深入挖掘国有和非国有服务业企业在创新词频和主题上的差异,揭示非国有服务业企业创新水平较高的本质原因。基于此,从拓展服务创新内涵新认知、加快生活性服务业企业创新、营造良好创新生态、深化数字技术渗透以及发挥差异性优势五个方面提出政策建议,以期为加快服务业企业创新发展提供政策启示。 展开更多
关键词 LDA主题模型 服务业企业 创新测度 分析师报告 文本分析
原文传递
避而不谈抑或巧言令色?薪酬不公平与非财务信息的薪酬辩护效应
8
作者 王雄元 胡彩霞 《中央财经大学学报》 CSSCI 北大核心 2024年第6期76-88,共13页
价值相关性越来越高的非财务信息是否具有薪酬辩护效应?既有文献仅在文本可读性上找到了证据。本文基于“管理层讨论与分析”(MD&A)文本,从文本相似度角度探讨非财务信息的薪酬辩护效应。研究发现:(1)存在超额薪酬时,公司会提高MD&a... 价值相关性越来越高的非财务信息是否具有薪酬辩护效应?既有文献仅在文本可读性上找到了证据。本文基于“管理层讨论与分析”(MD&A)文本,从文本相似度角度探讨非财务信息的薪酬辩护效应。研究发现:(1)存在超额薪酬时,公司会提高MD&A文本相似度,即公司对普遍存在的超额薪酬采取了“避而不谈”的辩护策略,而且这种策略更可能发生在业绩辩护手段匮乏的情形下,会减少风险、人力资源以及薪酬主题的信息披露。(2)但当超额薪酬较极端时,公司会降低MD&A文本相似度,“巧言令色”地为其辩护,而且这种策略更可能发生在业绩辩护手段较为有效的情形下,会增加风险、人力资源以及薪酬主题的信息披露。这些结论有助于从非财务信息文本操纵角度丰富薪酬辩护假说,以及从薪酬披露角度丰富非财务信息文本操纵的经济后果。 展开更多
关键词 超额薪酬 薪酬辩护 文本相似度 文本主题
下载PDF
数字政府政策央地协同量化研究——基于三维分析框架的文本分析
9
作者 陈美 聂佳睿 《情报理论与实践》 CSSCI 北大核心 2024年第10期82-93,150,共13页
[目的/意义]数字政府建设是政府改革的重要驱动力之一,央地数字政府政策形成良好的协同状态可以最大化发挥数字政府建设转变政府职能、打破信息壁垒等作用。通过对数字政府政策央地协同状况的量化研究,可以厘清央地数字政府政策目标瞄... [目的/意义]数字政府建设是政府改革的重要驱动力之一,央地数字政府政策形成良好的协同状态可以最大化发挥数字政府建设转变政府职能、打破信息壁垒等作用。通过对数字政府政策央地协同状况的量化研究,可以厘清央地数字政府政策目标瞄准、文本创新与施行成效现状。[方法/过程]以2019—2023年央地336项数字政府政策为研究样本,利用LDA主题建模法、Doc2Vec、PMC指数分析法建立“主题响应度—文本相似度—成效协同度”三维分析框架,进行数字政府政策央地协同状况量化研究。[结果/结论]央地现有数字政府政策数量较多,但省份间、地区间存在较大差异,央地政策主题协同效果良好,政策文本承继与创新呈现平衡状态,部分省份政策成效需要进一步加强,以促进央地政策良性耦合与扩散发展。 展开更多
关键词 数字政府 央地协同 政策文本 LDA主题模型 Doc2Vec PMC指数模型
原文传递
英语学术语篇人际主位的学科特点与学科语境动因
10
作者 石琳 《吉首大学学报(自然科学版)》 CAS 2024年第1期84-91,共8页
对物理学、化学、环境工程、社会学、语言学、历史学、文学7个学科学术语篇中人际主位意义及词汇语法形式进行了分析.结果显示,不同学科的语篇在人际主位上既有共性,又展现出独特的学科特点;学术语篇中人际主位的选择受研究对象的特点... 对物理学、化学、环境工程、社会学、语言学、历史学、文学7个学科学术语篇中人际主位意义及词汇语法形式进行了分析.结果显示,不同学科的语篇在人际主位上既有共性,又展现出独特的学科特点;学术语篇中人际主位的选择受研究对象的特点、知识发展的性质、研究的程序与方法、研究者与知识的关系、研究成果的表现形式等学科语境因素影响. 展开更多
关键词 学术语篇 人际主位 学科特点 学科语境
下载PDF
长三角地区高新技术产业政策文本量化研究——基于919份政策文本的二模网络分析
11
作者 储伊力 曹振祥 +2 位作者 储节旺 凌丽 吴娟 《数字图书馆论坛》 CSSCI 2024年第2期44-57,共14页
揭示长三角地区高新技术产业政策的演化特征,为政策制定者优化顶层设计、完善政策体系提供参考建议。以1991—2022年长三角地区919份高新技术产业政策文本为研究对象,基于政策主题、政策发文主体和政策工具3个维度,利用自然语言处理、... 揭示长三角地区高新技术产业政策的演化特征,为政策制定者优化顶层设计、完善政策体系提供参考建议。以1991—2022年长三角地区919份高新技术产业政策文本为研究对象,基于政策主题、政策发文主体和政策工具3个维度,利用自然语言处理、二模网络分析、主题编码等方法对高新技术产业政策文本进行量化研究,并对结果进行可视化呈现。研究发现:(1)政策主题方面,政府关注的领域越来越多元化、系统化和具体化,但是政策较强调政府的宏观指导和对行政手段的使用,较少涉及市场及长三角一体化发展等方面;(2)政策发文主体方面,市级及以下级别发文主体开始发挥作用,且专业化、个性化、基层化的发文主体越来越多,政策发文主体的区位分布不够均衡;(3)政策工具方面,环境型政策工具使用最多,需求型政策工具使用不足,政策工具的使用与地区、发展阶段和时代背景相关。基于上述问题,提出具体的政策建议,包括:增强政策的区域协同性;建立健全高新技术产业政策的市场化机制;优化对政策工具的使用。 展开更多
关键词 高新技术产业 产业政策 文本分析 政策工具 政策主题 政策发文主体 二模网络
下载PDF
政策工具视角下我国“双碳”政策研究——基于中央层面政策文本的分析
12
作者 张瑞熙 《西部学刊》 2024年第22期34-38,共5页
“双碳”政策是实现我国碳达峰、碳中和目标的关键和抓手,以我国2020—2024年中央层面的48份“双碳”政策文本为研究对象,通过构建“政策文本内容—政策文本属性—政策主题特征”三维分析框架,运用政策计量法、内容分析法进行分析。研... “双碳”政策是实现我国碳达峰、碳中和目标的关键和抓手,以我国2020—2024年中央层面的48份“双碳”政策文本为研究对象,通过构建“政策文本内容—政策文本属性—政策主题特征”三维分析框架,运用政策计量法、内容分析法进行分析。研究发现,在政策文本内容维度,存在政策工具使用不均衡,供给型政策工具使用不足、环境型政策工具使用过溢、需求型政策工具使用短缺;在政策文本属性维度,存在政策颁布主体单一、政策文本效力不足;在政策主题特征维度,政策文本适配度较低、政策力度有待增强。基于此,提出促进政策工具结构合理,强化政策主体协同,增强政策适用等建议,以进一步优化我国“双碳”政策体系。 展开更多
关键词 “双碳”政策 文本内容 文本属性 主题特征
下载PDF
动态视域下基于生成式拓扑映射的潜在研发商业化机会识别研究
13
作者 冯立杰 李鹏月 +2 位作者 王金凤 张珂 林国义 《信息资源管理学报》 CSSCI 2024年第3期149-160,F0003,共13页
在竞争日益激烈的市场环境中,客观精准识别潜在研发商业化机会对企业降低盲目创新风险进而抢占市场先机至关重要。本文从动态视域出发,利用商标及专利文本数据,提出了一种基于生成式拓扑映射的潜在研发商业化机会识别方法。通过商标空... 在竞争日益激烈的市场环境中,客观精准识别潜在研发商业化机会对企业降低盲目创新风险进而抢占市场先机至关重要。本文从动态视域出发,利用商标及专利文本数据,提出了一种基于生成式拓扑映射的潜在研发商业化机会识别方法。通过商标空白的映射与逆映射、商标空白与专利的文本相似度计算,结合商标空白的主题演化分析结果,精准识别出了潜在研发商业化机会。最后以智能家居系统领域为例,验证了本文所提方法的有效性。研究结果表明,通过揭示所选目标领域商业空白的演化路径,可识别出该领域具有潜在研发商业价值的研发商业化机会,进而为企业高效开展技术与市场创新提供靶向性参考思路。 展开更多
关键词 动态视域 研发商业化 机会识别 生成式拓扑映射 商标空白主题演化分析 文本相似度
下载PDF
基于LDA模型的我国乡村文化政策主题挖掘与演化分析——与乡村文化科研论文对比视角
14
作者 胡卉 《图书馆研究》 2024年第1期119-128,共10页
基于乡村文化主题,以396条政策文本和1 480条科研论文为样本,运用主题建模的方法分析政策与科研的异同情况。通过对比发现,当前乡村文化政策还存在有待完善和调整之处,由此提出未来乡村文化政策的发展方向,具体包括提升乡村文化认同、... 基于乡村文化主题,以396条政策文本和1 480条科研论文为样本,运用主题建模的方法分析政策与科研的异同情况。通过对比发现,当前乡村文化政策还存在有待完善和调整之处,由此提出未来乡村文化政策的发展方向,具体包括提升乡村文化认同、加强公共文化服务供给、完善文化产业发展配套政策、培育文化消费市场。 展开更多
关键词 乡村文化 主题识别 主题演化 文本计算
下载PDF
基于网络文本分析的黄山市民宿游客感知研究
15
作者 彭润华 苌静 钳硕 《黄山学院学报》 2024年第1期33-39,共7页
以游客感知理论为基础,以网络文本分析为研究方法,基于游客感知视角,利用Python及ROST Content Mining 6软件对黄山市民宿形象进行研究。对从携程旅行网所爬取的评论文本进行高频词分析,并制作词云图及语义网络图,同时利用LDA主题模型... 以游客感知理论为基础,以网络文本分析为研究方法,基于游客感知视角,利用Python及ROST Content Mining 6软件对黄山市民宿形象进行研究。对从携程旅行网所爬取的评论文本进行高频词分析,并制作词云图及语义网络图,同时利用LDA主题模型将评论文本内容归纳为5个主题,分别为地理位置、服务质量、游客体验、推荐意愿和装修设计,然后构建情感词典,对评论文本进行情感值分析,发现游客对民宿的整体满意度较高,负面情感主要聚焦在设施、卫生和噪音等方面,最后从加强民宿智能化建设、利用网络资源倾听游客心声、促进民宿品牌文化建设三个方面给出提高游客满意度、提升游客住宿体验的对策。 展开更多
关键词 网络文本分析 游客感知 LDA主题模型
下载PDF
中国战略性新兴产业政策演变态势分析:政策组合视角
16
作者 吴柳洁 郭京京 《创新科技》 2024年第3期12-26,共15页
通过政策组合视角,指出中国战略性新兴产业政策演变经历了战略部署期(2009—2015年)、支持发展期(2016—2020年)和统筹整合期(2021年至今)等3个阶段。总体而言,中央层面战略性新兴产业政策工具以系统构建和技术推动为主,重点关注知识产... 通过政策组合视角,指出中国战略性新兴产业政策演变经历了战略部署期(2009—2015年)、支持发展期(2016—2020年)和统筹整合期(2021年至今)等3个阶段。总体而言,中央层面战略性新兴产业政策工具以系统构建和技术推动为主,重点关注知识产权、体制机制构建、行业规范等政策主题。其中:战略部署期注重系统构建,在政策主题上强调服务平台建设;支持发展期强调激发创新活力,着力开展行业规范与基础设施建设;统筹整合期注重加大技术推动力度,支持知识产权保护。在政策文本分析的基础上,得出中国现有战略性新兴产业政策体系存在对需求拉动类政策工具关注不足、政策主题过于集中等问题,并提出针对性的对策建议。 展开更多
关键词 战略性新兴产业 政策组合 政策文本量化 政策目的 政策主题
下载PDF
政策主题视角下我国政府数据治理政策演进研究
17
作者 吴涵 肖明 +2 位作者 郭珺曜 张星渊 徐卓琪 《情报探索》 2024年第5期87-95,共9页
[目的/意义]我国政府数据治理框架处于不断的发展过程之中,分析数据治理的政策主题的演进与变迁,能够梳理政策发展脉络,指导数据治理政策体系的发展与完善。[方法/过程]系统收集中央层面政府数据治理政策,建构发展阶段,并借助LDA主题模... [目的/意义]我国政府数据治理框架处于不断的发展过程之中,分析数据治理的政策主题的演进与变迁,能够梳理政策发展脉络,指导数据治理政策体系的发展与完善。[方法/过程]系统收集中央层面政府数据治理政策,建构发展阶段,并借助LDA主题模型提取各阶段的重点主题,分析我国政府数据治理政策关注重点的演变与各阶段特征。[结果/结论]我国政府数据治理政策沿着“发展环境酝酿—政府数据价值释放—社会数据化转型”的路径不断演变发展,覆盖范围逐渐从政府内部拓宽至全社会,作用机制逐渐从政府主导转向鼓励市场发展,作用环节逐渐从数据收集、组织扩散至开发、利用等数据生命周期各环节,但数据安全问题始终是关注重点。 展开更多
关键词 数据治理 LDA主题模型 文本挖掘 政策演进
下载PDF
十五大以来历次党代会大会主题的文本分析
18
作者 温习勇 《安康学院学报》 2024年第2期44-49,共6页
在党的全国代表大会报告中提出大会主题始于党的十五大。大会主题是党代会报告的眼睛,也是大会的主旨和灵魂。分析十五大以来历次党代会报告的大会主题可以看出,每一次党代会报告所确定的大会主题都在科学判断和准确分析世情、国情、党... 在党的全国代表大会报告中提出大会主题始于党的十五大。大会主题是党代会报告的眼睛,也是大会的主旨和灵魂。分析十五大以来历次党代会报告的大会主题可以看出,每一次党代会报告所确定的大会主题都在科学判断和准确分析世情、国情、党情新变化的基础上,明确提出和着重强调了旗帜问题、道路问题、精神状态问题和奋斗目标问题。同时,历次党代会大会主题既一脉相承又与时俱进,充分体现了党的历史发展的连续性和阶段性的统一。回顾和研究十五大以来历次党代会报告的大会主题,既有助于我们从微观视角全面理解把握党在各个发展时期的历史使命,也有助于我们深入学习贯彻党的二十大精神,从而坚定不移地沿着党所指引的方向踔厉奋发、勇毅前行。 展开更多
关键词 中国共产党 十五大以来历次党代会 大会主题 文本分析
下载PDF
基于文本挖掘技术的网络舆情采集与分析应用研究
19
作者 纪波林 《数字通信世界》 2024年第9期139-141,共3页
该文就基于文本挖掘技术的网络舆情采集与分析应用展开研究,从网络舆情生命周期理论、网络舆情采集与分析相关技术、中文分词算法、文本挖掘技术、以及具体的文本预处理、词频分析和LDA主题建模等方面展开讨论。在网络舆情数据预处理中... 该文就基于文本挖掘技术的网络舆情采集与分析应用展开研究,从网络舆情生命周期理论、网络舆情采集与分析相关技术、中文分词算法、文本挖掘技术、以及具体的文本预处理、词频分析和LDA主题建模等方面展开讨论。在网络舆情数据预处理中,通过去噪、自定义词典及分词、停用词过滤等手段,可提升数据质量,文本词频分析利用TF-IDF算法,准确挖掘关键词,深入理解舆情事件的重要性,而LDA主题建模技术则通过发现主题结构,为舆情事件提供更为深刻的分析视角。研究表明,通过建立起舆情监测管理机制,可以更好地构建网络舆情环境。 展开更多
关键词 网络舆情分析 文本挖掘技术 LDA主题建模
下载PDF
基于NLP的股票选择策略的优化研究
20
作者 吴彦昕 李宏滨 胡冠真 《现代计算机》 2024年第3期76-82,共7页
由于股评、新闻对股票价格变化有巨大影响,为选出优质股票以提高投资的收益率,采用了自然语言处理NLP技术对股评数据和新闻数据进行分析,基于朴素贝叶斯模型建立了文本情感倾向分类模型,模型预测准确率达到84%,生成了股评因子。基于LDA... 由于股评、新闻对股票价格变化有巨大影响,为选出优质股票以提高投资的收益率,采用了自然语言处理NLP技术对股评数据和新闻数据进行分析,基于朴素贝叶斯模型建立了文本情感倾向分类模型,模型预测准确率达到84%,生成了股评因子。基于LDA主题模型对新闻文本进行话题建模,快速获取新闻文本主题,并引入困惑度寻找文档最优主题数,生成了新闻因子,将股评因子和新闻因子作为筛选股票的依据,从股评和新闻信息中获取对股市带来的影响因素,从而优化选股策略。对于股票基本面数据,采用决策树模型进行因子的重要性分析,选出重要性最高的前5个因子,模型预测准确率达到88%。通过决策树模型,可以更准确地确定哪些因子在影响股价变化方面发挥着关键作用,这种改进的方法能够提高选股策略的有效性和准确性。最终使用主成分分析(PCA)对数据进行降维处理,依据主成分数值的高低来进行股票选择。 展开更多
关键词 自然语言处理 文本情感倾向分类模型 LDA主题模型 决策树模型 主成分分析
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部