题名 基于级联模型的中文情感要素抽取
被引量:2
1
作者
王亚珅
黄河燕
冯冲
刘全超
机构
北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心
出处
《电子学报》
EI
CAS
CSCD
北大核心
2016年第10期2459-2465,共7页
基金
国家重点基础研究发展计划(973计划)资助项目(No.2013CB329605
No.2013CB329303)
+1 种基金
国家自然科学基金(No.61132009
No.61201351)
文摘
随着社交媒体的发展及成熟,每天在互联网环境中都会产生大量的用户评论信息.抽取评价短语、评价对象和观点持有者等情感要素,已经成为了中文观点挖掘和情感分析的重要先决任务.针对中文情感要素抽取任务,本文提出了一个统计和规则相结合的级联模型,主要贡献包括:(1)针对汽车领域评论信息,构建情感要素标注语料库和相关词典;(2)对于以往研究较少关注的中文评价短语,本文详细分析阐述其定义和分类;(3)结合统计和规则,分别针对评价短语和情感要素提出级联抽取策略.实验结果充分证明了该级联模型的有效性,相比较于其它基于规则的情感要素抽取算法有效提升了召回率,同时为后续社交媒体情感分析任务提供了有力的支持.
关键词
信息抽取
情感要素
评价短语
评价对象
观点持有者
Keywords
information extraction
evaluation element
evaluation phrase
comment target
opinion holder
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于最小割图分割的社区发现算法
被引量:3
2
作者
王亚珅
黄河燕
冯冲
机构
北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心
出处
《中文信息学报》
CSCD
北大核心
2017年第3期213-222,共10页
基金
国家高技术研究发展计划(863计划)(2015AA015404)
文摘
该文证明了模块度最大化问题可以被转换成为原网络上的最小割图分割问题,并且基于该证明提出了一种高效的社区发现算法。同时,该文创新性地将模块度理论与当今比较流行的统计推理模型相结合:首先,这些统计推理模型被转化为模块度最大化问题中的零模型;其次,统计推理模型中的目标函数被修改并应用于本文的最优化算法中。实验结果显示,无论是在真实世界网络还是在人工生成网络中,该文提出的算法均具有高效和稳定的发现社区的能力。
关键词
社区发现
模块度
最小割图分割
Keywords
community detection
modularity
minimum cut graph partitioning
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 最长评价短语及其情感评价搭配抽取方法
3
作者
刘全超
黄河燕
王亚珅
冯冲
机构
北京理工大学计算机学院
出处
《数据采集与处理》
CSCD
北大核心
2016年第2期296-306,共11页
基金
国家重点基础研究发展计划("九七三"计划)(2013CB329605)资助项目
文摘
提出一种统计和规则相结合的最长评价短语自动识别算法。将评价短语的识别问题转化为序列标注问题,结合条件随机场模型进行简单结构的评价短语识别,在此基础上进一步建立和应用规则库,自动识别结构复杂的最长评价短语,其测试的F值达到72.38%。在最长评价短语自动识别的基础上,构建用于评价对象抽取和情感评价单元抽取的规则库,提出基于规则的评价搭配自动抽取算法,实现评价对象和最长评价短语搭配的自动抽取,在网易汽车门户网站进行了系统测试,得到了较高的准确率。
关键词
情感分析
观点挖掘
评价短语
条件随机场
Keywords
sentiment analysis
opinion mining
evaluation phrase
conditional random fields
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于注意力机制的概念化句嵌入研究
被引量:8
4
作者
王亚珅
黄河燕
冯冲
周强
机构
北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心
百度在线网络技术(北京)有限公司
出处
《自动化学报》
EI
CSCD
北大核心
2020年第7期1390-1400,共11页
基金
国家自然科学基金重点项目(61751201)资助。
文摘
大多数句嵌模型仅利用文本字面信息来完成句子向量化表示,导致这些模型对普遍存在的一词多义现象缺乏甄别能力.为了增强句子的语义表达能力,本文使用短文本概念化算法为语料库中的每个句子赋予相关概念,然后学习概念化句嵌入(Conceptual sentence embedding,CSE).因此,由于引入了概念信息,这种语义表示比目前广泛使用的句嵌入模型更具表达能力.此外,我们通过引入注意力机制进一步扩展概念化句嵌入模型,使模型能够有区别地选择上下文语境中的相关词语以实现更高效的预测.本文通过文本分类和信息检索等语言理解任务来验证所提出的概念化句嵌入模型的性能,实验结果证明本文所提出的模型性能优于其他句嵌入模型.
关键词
句嵌入
短文本概念化
注意力机制
词嵌入
语义表达
Keywords
Sentence embedding
short-text conceptualization
attention mechanism
word embedding
semantic representation
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 面向数据共享交换的联邦学习技术发展综述
被引量:13
5
作者
王亚珅
机构
中国电子科技集团公司电子科学研究院社会安全风险感知与防控大数据应用国家工程实验室
出处
《无人系统技术》
2019年第6期58-62,共5页
基金
国家重点研发计划项目(2017YFC0820503)
中国电科新一代人工智能专项行动计划项目(AI20191125008)
+4 种基金
中国电科装备预研联合基金项目(6141B08010102)
全国一体化国家大数据中心先导工程(17111001,17111002)
国家自然科学基金项目(U19B2026)
中国博士后科学基金第64批面上资助项目(2018M641436)
文旅部2018年度文化和旅游智库项目(18K01)
文摘
联邦学习是一种新兴的人工智能基础技术,其设计目标是在保障大数据共享交换时的信息安全、保护终端个人数据隐私、保证合法合规的前提下,在多参与者或多计算节点之间开展高效率的机器学习,有望成为下一代人工智能协同算法和协作网络的基础。对近期联邦学习的相关研究与成果进行了综合评述,并对未来发展趋势进行了展望。首先,从数据孤岛和隐私保护等两个角度介绍联邦学习的兴起背景,并概述联邦学习内涵与机理;随后,聚焦技术革新和标准化建设“双轮驱动”,概述联邦学习最新进展,并以公共文化服务领域为示范应用场景,介绍基于联邦学习技术的数据共享交换典型应用案例;最后,从通信费用高、统计异构性、系统异构性、隐私问题等四个角度讨论联邦学习面临的困难与挑战。
关键词
联邦学习
数据共享交换
人工智能
隐私安全
数据孤岛
机器学习
系统架构设计
分布式计算
Keywords
Federated Learning
Data Sharing and Exchange
Artificial Intelligence
Privacy Security
Data Is⁃land
Machine Learning
System Architecture Design
Distributed Computing
分类号
TN915.
[电子电信—通信与信息系统]
题名 2020年深度学习技术发展综述
被引量:3
6
作者
王亚珅
机构
中国电子科技集团公司电子科学研究院
出处
《无人系统技术》
2021年第2期1-7,共7页
基金
国家自然科学基金(U19B2026)
中国电科新一代人工智能专项行动计划项目(AI20191125008)
全国一体化国家大数据中心先导工程(17111002,20500908)。
文摘
对深度学习领域的研究进行综合评述,并对其进一步发展方向进行分析。首先分析围绕注意力机制的深度学习技术最新研究成果,以及在自然语言处理领域取得突破性进展的巨型预训练模型的特点与发展路径;随后概述开源深度学习市场的火热局面及其对技术升级的推动作用;最后分别从香农定律、冯·诺依曼架构、摩尔定律三个角度探讨深度学习技术的未来发展方向。综述表明,注意力机制和预训练范式在当前计算机视觉和自然语言处理等深度学习重点应用领域中取得长足技术突破,开源深度学习市场的兴起有效推动产学研用各领域深度学习技术落地,在今后很长一段时间里,深度学习依然具有很广阔的发展空间。
关键词
深度学习
注意力机制
预训练
神经网络
开源
人工智能
Keywords
Deep Learning
Attention Mechanism
Pre-Training
Neural Network
Open-Source
Artificial Intelligence
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
题名 基于食品抽检数据的风险预警智能研究模型构建分析
被引量:6
7
作者
韩世鹤
李红
江逸楠
李立
李家琦
王亚珅
机构
中国检验检疫科学研究院
重庆市食品药品检验检测研究院
中国电子科学研究院
出处
《食品安全质量检测学报》
CAS
北大核心
2022年第10期3172-3179,共8页
基金
国家市场监督管理总局科技计划项目(2019MK129)
国家重点研发计划资助项目(2017YFC1602000)。
文摘
近年来,国内外由食品安全问题导致的公共健康事件屡见不鲜。食品安全问题涉及食品产业链的各个环节,收集和识别食品安全风险因子,挖掘造成食品安全的重要因素,是食品安全风险预警的重要途径,也是制定管理措施的前提条件。有效利用和分析食品安全信息,开展有效预警,已经成为食品安全监管面临的重要问题。本文首先分析了食品抽检数据特征和食品安全预警模型原则,在此基础上从风险分析、趋势分析、关联挖掘、全息画像和效能评价等视角构建了基于食品抽检数据的风险预警智能分析模型。该模型旨在为食品安全的监管、消费、生产等各个环节提供有力支撑,为推进基于食品抽检数据的风险预警智能研究提供参考。
关键词
食品安全
食品抽检数据
风险预警
智能分析
Keywords
food safety
sampling food data
risk warning
intelligent analysis
分类号
F203
[经济管理—国民经济]
题名 基于集成聚类的社区发现算法
被引量:1
8
作者
江逸楠
刘家琛
王亚珅
张欣海
张博
机构
中国电子科学研究院
西安电子科技大学
出处
《中国电子科学研究院学报》
北大核心
2020年第4期382-387,共6页
基金
国家重点研发计划(2017YFC0820503)
北京市科技新星计划项目(Z181100006218041)
北京市科技计划项目(Z181100009018008)。
文摘
社区发现对于理解复杂系统的整体组织及其功能特性具有重要意义,在个性化服务、广告营销、舆情传播甚至犯罪团伙发现等领域具有广泛的应用场景。近年来,在机器学习聚类问题方面获得较好效果的集成聚类被引入社区发现问题的研究中,以提升社区发现的精确度和稳定性。本文通过将集成方法、集成聚类选择与社区发现相结合,提出了一个社区发现的集成聚类方法框架。首先通过集成选择获得较高质量的集成成员子集,之后通过模块度赋予成员不同的重要性权值,从而集成成员中发现的信息来改进社区发现效果。在几个真实网络上与其他经典社区发现算法进行对比实验的结果显示出基于该框架能有效提高社区发现的精确度。
关键词
社区发现
集成聚类
集成选择
Keywords
Community Detection
Ensemble Clustering
Ensemble Selection
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 2023年人工智能领域科技发展综述
被引量:4
9
作者
王亚珅
陈浩
葛悦涛
朱小伶
欧阳小叶
机构
中国电科智能科技研究院
中国人民解放军国防科技大学电子对抗学院
中国信息通信研究院
中国电子科技集团有限公司电子科学研究院
出处
《战术导弹技术》
北大核心
2024年第1期20-32,67,共14页
基金
国家自然科学基金(62106243
U19B2026)。
文摘
人工智能技术已经成为推动军事变革的重要力量,不仅催生了全新的战争样式,而且显著提升了军事作战能力。为研究人工智能技术发展及其军事应用现状,梳理和总结了2023年人工智能领域最新科技进展。综述表明:美国、欧盟等世界主要国家和国际组织在顶层战略、研发投资、技术规制等方面持续加强人工智能战略布局;军事智能在生成式智能、人机混合智能、群体智能、具身智能、平行智能等技术领域发展势头强劲;世界主要军事强国将人工智能视为未来战场制胜的核心技术,正在快速将人工智能广泛并深化应用于陆战、海战、空战等多作战域。为进一步提升军事智能化水平,提出宏观战略规划与微观技术评估并重、技术理论研究与领域实战应用并举等发展建议。
关键词
人工智能
军事智能
生成式人工智能
人机混合智能
群体智能
具身智能
平行智能
Keywords
artificial intelligence
military intelligence
generative artificial intelligence
human-ma⁃chine hybrid intelligence
swarm intelligence
embodied intelligence
parallel intelligence
分类号
E91
[军事]
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 2023年生成式人工智能技术主要发展动向分析
被引量:3
10
作者
王亚珅
方勇
江昊
曾园园
白然
机构
中国电科智能科技研究院中国电科认知与智能技术重点实验室
中国人民解放军军事科学院军事科学信息研究中心
武汉大学电子信息学院
中国电子科技集团有限公司电子科学研究院社会安全风险感知与防控大数据应用国家工程研究中心
出处
《无人系统技术》
2024年第2期101-112,共12页
基金
国家自然科学基金(62106243,U19B2026)。
文摘
生成式人工智能已经成为人工智能的最前沿技术之一,被认为是通往通用人工智能的重要阶梯。对2023年生成式人工智能的主要发展动向进行了综合评述。首先盘点生成式人工智能技术当前发展状态;其次概述生成式人工智能技术未来发展趋势;最后探讨生成式人工智能的军事应用潜力。综述表明,多模态性和可解释性是当前生成式人工智能技术的热门方向,生成式人工智能技术的应用使强调指令理解推理的机器人、强调归纳推理的基础科学等领域不断取得突破,面向终端用户的“轻量化”和面向开发者的“开源化”势头正盛,与此同时,对生成式人工智能技术应用的监管也迫在眉睫。综述认为,深度融合多模态、建设高质量数据资源及评估手段、强调与环境自主交互、在边缘侧低成本应用部署、平衡技术发展与规制治理等,将是生成式人工智能技术在未来的重要发展方向。
关键词
生成式人工智能
多模态
可解释性
具身智能
轻量化
开源
监管
Keywords
Generative Artificial Intelligence
Multimodality
Interpretability
Embodied Intelligence
Lightweight
Open-source
Supervision
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
题名 基于卷积神经网络的舆情触发词解析方法
11
作者
李阳阳
王亚珅
金昊
机构
中国电子科技集团公司电子科学研究院
出处
《科技与创新》
2021年第14期155-157,159,共4页
基金
中国电科新一代人工智能专项行动计划项目(编号:AI20191125008)资助。
文摘
在互联网普及和信息全面流通的全媒体时代,加强舆论监管是促进社会和谐的必要手段。想要准确地检测和获取舆情信息,检测事件及事件触发词是关键所在。提出一种基于卷积神经网络的舆情触发词解析方法,通过卷积神经网络进行自动隐藏特征的提取,并对舆情触发词进行识别和分类,可以自动高效准确地定位舆情关键事件触发词,进而对事件进行抽取,从而达到解析舆情信息的目的。
关键词
舆情触发词解析
舆情触发词分类
全媒体
卷积神经网络
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
题名 基于双向编码表示预训练模型的舆情文本解析分类
12
作者
金昊
王亚珅
李阳阳
机构
中国电子科技集团公司电子科学研究院
出处
《科技与创新》
2021年第13期118-120,123,共4页
基金
中国电科新一代人工智能专项行动计划项目(编号:AI20191125008)资助。
文摘
随着人工智能和大数据的不断发展,网络数据呈现爆炸式的增长,日益增长的庞大数据量给网络舆情监测分析带来了挑战,急需一种应对海量数据的文本分类算法来自动识别和分类舆情信息。提出一种基于双向编码表示(BERT,Bidirectional Encoder Representations from Transformers)预训练模型的舆情文本解析分类方法。首先将文本输入到词典编码器中;随后通过多层转换器编码将输入特征映射成为一个上下文关联的特征向量;最后为了捕获局部信息,使用卷积神经网络进一步编码并将编码后的信息输入到分类器预测舆情文本属性。
关键词
舆情文本解析
舆情文本分类
自然语言处理
机器学习
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 2023年深度学习技术主要发展动向分析
被引量:2
13
作者
王亚珅
葛悦涛
鞠卓亚
郭大宇
韩嘉祺
刘文华
机构
中国电科智能科技研究院中国电科认知与智能技术重点实验室
中国信息通信研究院
[
中国电子科技集团有限公司电子科学研究院社会安全风险感知与防控大数据应用国家工程研究中心
出处
《无人系统技术》
2024年第1期50-58,共9页
基金
国家自然科学基金(62106243,U22B2061,U19B2026)。
文摘
深度学习已成为人工智能领域的研究热点和主流发展方向之一,为诸多重要应用领域带来了革命性的进步。对2023年深度学习技术热门领域的主要发展动向进行了综合评述。首先介绍了深度学习技术发展现状,其次探讨了深度学习技术的军事应用任务和挑战,最后盘点了深度学习技术的未来重点发展方向。综述表明,大语言模型是深度学习领域在2023年最突出的亮点,世界模型框架下的自监督学习技术、强化学习框架下的人工智能智能体技术等也呈现加速发展态势;环境恶劣与强干扰复杂条件下的高鲁棒性深度学习、面向实时流数据高效处理与内在逻辑关联的深度学习、面向多变作战场景自主决策与快速决策的深度学习、面向跨域数据协同感知与协同推理的深度学习等,是深度学习技术未来重要的发展方向。
关键词
深度学习
人工智能
大语言模型
多模态
自监督学习
强化学习
人工智能智能体
Keywords
Deep Learning
Artificial Intelligence
Large Language Model
Multimodality
Self-supervised Learning
Reinforcement Learning
AI Agent
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
题名 基于食品抽检数据的区域性风险预警模型构建
14
作者
韩世鹤
江逸楠
李红
李家琦
李立
王亚珅
机构
中国检验检疫科学研究院食品安全危害分析与关键控制点(HACCP)研究所
中国检验检疫科学研究院国家市场监督管理总局重点实验室(食品质量与安全)
中国电子科学研究院
重庆市食品药品检验检测研究院
出处
《食品工业》
CAS
2024年第10期112-117,共6页
基金
国家市场监督管理总局科技计划项目(2022MK195)。
文摘
挖掘影响食品安全的重要因素,识别各区域食品安全风险,可为食品安全治理提供依据。文章从8个不同区域(7个国内区域A~G和1个境外区域H)视角对一定量的食品抽检数据进行分析,首先针对不同区域的不合格率进行排序,而后采用二项检验方法对于各区域食品大类的食品安全风险等级进行了划分。研究发现,各区域抽检批次存在较大差异,高风险的区域食品大类组合为5组,中风险的区域食品大类组合为38组,可为食品安全的风险监测及预警提供参考。对不同地区进行食品抽检数据分析,有助于实现食品安全的精准抽样分析、风险监控、风险隐患预测及相关食品安全研究,从而全面提升食品安全水平。
关键词
食品监督
抽检数据
食品安全
预警分析
区域预警
Keywords
food supervision
sampling data
food safety
early warning analysis
regional warning
分类号
F20
[经济管理—国民经济]
题名 2022年深度学习技术主要发展动向分析
被引量:4
15
作者
王亚珅
胡武陵
朱小伶
葛悦涛
机构
中国电科智能科技研究院中国电科认知与智能技术重点实验室
北京燕山电子设备厂
中国电子科技集团公司电子科学研究院社会安全风险感知与防控大数据应用国家工程研究中心
中国信息通信研究院
出处
《无人系统技术》
2023年第1期104-113,共10页
基金
国家自然科学基金(62106243,U19B2026,U19B2038)。
文摘
深度学习正逐渐成为新一代人工智能最核心的技术之一。对2022年深度学习热门领域的主要发展动向进行了综合评述。首先,介绍小数据小样本深度学习研究领域的最新进展;其次,探讨量子计算与深度学习的融合路径;然后,概述强化学习对通用智能的推动作用;最后,盘点深度学习在多模态学习方向的进展。综述表明,面向小数据、小样本的深度学习技术正在引领深度学习向自监督方向不断迈进,深度学习与其他先进计算范式(例如量子计算等)深入融合趋势愈发明显,强化学习在一定程度上具备解决复杂问题的通用智能,多模态深度学习技术已迎来关键性突破。
关键词
深度学习
小数据
量子计算
预训练
强化学习
多模态学习
Keywords
Deep Learning
Small Data
Quantum Computing
Pre-training
Reinforcement Learning
Multimodal Learning
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
题名 ChatGPT对社交机器人技术发展的影响分析
被引量:3
16
作者
王亚珅
李强
石戈
鞠卓亚
刘晨羽
机构
中国电科智能科技研究院中国电科认知与智能技术重点实验室
陆军研究院科技创新中心
中国科学院自动化研究所复杂系统管理与控制国家重点实验室
北京工业大学信息学部
中国电子科技集团公司电子科学研究院社会安全风险感知与防控大数据应用国家工程研究中心
出处
《无人系统技术》
2023年第2期95-102,共8页
基金
国家自然科学基金(62106243,U19B2026,U19B2038)。
文摘
作为生成式人工智能的典型代表,全新的预训练基础模型ChatGPT已成为各界关注的“现象级”讨论热点。对ChatGPT及其对社交机器人技术发展的影响与启发进行综合评述。首先介绍了ChatGPT的概念内涵、主要特征、发展历程;其次探讨了以ChatGPT为代表的预训练基础模型所反映出的当前人工智能技术发展趋势;最后分析了近来生成式人工智能的飞速发展对于社交机器人研究与应用的提升作用。综述表明,社交机器人对于内容自主生成能力的旺盛需求,使其与生成式人工智能的发展进度紧密耦合,未来将在个性化内容生成、生成内容鉴别与管制、“涌现”能力溯源等方面继续发展。
关键词
人工智能
预训练基础模型
人工智能生成内容
社交机器人
多模态学习
生成式人工智能
通用人工智能
Keywords
Artificial Intelligence
Pre-training Foundation Model
Al-generated Content
Social Robot
Multi-modal Learning
Generative Artificial Intelligence
Artificial General Intelligence
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
题名 2019年国外人工智能技术的发展及应用
被引量:3
17
作者
王亚珅
张龙
机构
中国电子科技集团公司电子科学研究院
中国电子科技集团有限公司
出处
《飞航导弹》
北大核心
2020年第1期46-50,共5页
基金
国家重点研发计划项目(2017YFC0820504)
中国电科新一代人工智能专项行动计划项目(AI20191125008)
+3 种基金
全国一体化国家大数据中心先导工程项目(17111001,17111002)
中国博士后科学基金第64批面上资助项目(2018M641436)
科技部国家科技重大专项项目(2018ZX09201014)
中国电科装备预研联合基金项目(6141B08010102)。
文摘
2019年,各国继续加大对发展人工智能技术的政策支持和经费投入,不断加快人工智能技术发展与应用进程,主要体现在:不断深化人工智能国家战略,加速人工智能技术研发;继续加大研发和探索力度,为人工智能军事作战赋能进程提速;深度学习、脑与认知、量子计算等基础技术领域取得多项理论创新,呈现加速发展态势;多措并举,夯实人工智能实践应用的道德准绳和安全边界。
关键词
人工智能
国家战略
作战赋能
道德原则
理论突破
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]