期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于多模态大语言模型的低延迟端到端自动驾驶模型
1
作者 金彦亮 顾晨杰 高塬 《工业控制计算机》 2025年第3期32-34,共3页
自动驾驶技术当前是科技领域的研究热点之一。针对当前自动驾驶领域中,端到端模型在可解释性和实时性之间无法权衡的问题,提出了一种基于多模态语言模型的低延迟端到端自动驾驶模型,利用多模态大语言模型对自动驾驶数据集进行决策原因... 自动驾驶技术当前是科技领域的研究热点之一。针对当前自动驾驶领域中,端到端模型在可解释性和实时性之间无法权衡的问题,提出了一种基于多模态语言模型的低延迟端到端自动驾驶模型,利用多模态大语言模型对自动驾驶数据集进行决策原因和关键物体的标注,并通过多任务学习来预测决策原因和关键目标,为决策过程提供直观解释的同时,避免了实时推理阶段直接使用大模型推理带来的推理延迟,从而在保证实时性的情况下增加了可解释性。通过仿真实验证明了该模型在提高驾驶完成率、减少模型违规行为与增强可解释性方面的有效性,为端到端自动驾驶领域的决策算法提供了新的思路。 展开更多
关键词 自动驾驶 多模态大语言模型 模仿学习 多任务学习
下载PDF
结合G312线清傅项目的多模态大语言模型在交通应急领域的研究与应用
2
作者 郑应玮 《科技与创新》 2025年第6期19-23,共5页
在交通应急领域,对交通事件的识别理解和快速响应占主要位置,但由于交通事件本身所具有的突发性、多样性、不确定性和紧迫性,导致识别和理解工作极具挑战,而多模态大语言模型(Multi-modal Large Language Models,MLLMs)的发展为这一难... 在交通应急领域,对交通事件的识别理解和快速响应占主要位置,但由于交通事件本身所具有的突发性、多样性、不确定性和紧迫性,导致识别和理解工作极具挑战,而多模态大语言模型(Multi-modal Large Language Models,MLLMs)的发展为这一难点提供了新的解决思路。文中选择了具有代表性的Mini-Gemini和Qwen-VL模型,从3个方面逐步探索多模态大语言模型在交通应急领域应用的可能性,深入研究多模态大语言模型对复杂交通事件的认知和推理能力,并结合正在建设中的G312线清水驿至傅家窑公路“5G+智慧公路”项目,为其提供技术落地应用思路。 展开更多
关键词 多模态大语言模型 交通应急 Mini-Gemini Qwen-VL
下载PDF
基于多模态大语言模型的攻击性模因解释生成方法 被引量:1
3
作者 林萌 戴程威 郭涛 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1206-1217,共12页
随着5G的发展,攻击性言论逐渐以多模态的方式在社交网络上广泛传播.因此,攻击性模因的检测与解释生成对于提高内容审核效果、维护和谐健康的舆论场环境有着重要的作用.现有的攻击性模因解释生成研究只关注于攻击对象和攻击内容,忽略了... 随着5G的发展,攻击性言论逐渐以多模态的方式在社交网络上广泛传播.因此,攻击性模因的检测与解释生成对于提高内容审核效果、维护和谐健康的舆论场环境有着重要的作用.现有的攻击性模因解释生成研究只关注于攻击对象和攻击内容,忽略了模因包含的社会背景知识和隐喻表达手法,无法全面、准确地解释攻击性模因的含义,大大限制了解释的应用范围.为了应对这一挑战,提出一种基于多模态大模型的攻击性模因解释生成方法,通过增强攻击目标、攻击内容和隐喻识别等多种指令数据,利用其微调多模态大模型,以提升大模型对攻击性模因的解释生成能力.实验结果证实,该方法生成的解释具有3点优势:一是相比基线模型在BERTScore评估指标上提高了19%;二是解释中包含了攻击性隐喻表达的相关背景知识;三是在处理未见的模因数据时也表现出良好的泛化性能. 展开更多
关键词 攻击性模因 解释生成 多模态大语言模型 数据增强 指令微调
下载PDF
基于多模态大语言模型的数字厨师与智能烹饪系统
4
作者 李鑫源 李柏 +4 位作者 孙跃硕 张坦探 田永林 殷烛炎 王飞跃 《智能科学与技术学报》 CSCD 2024年第4期429-444,共16页
面向高质量和精准烹饪的需求,提出一种基于多模态大语言模型的数字厨师与智能烹饪方法。离线阶段利用视觉、声音、温度等多源传感器记录专业厨师的连续操作,将图像与多轮问答文本融合,建立烹饪专家知识库,并采用低秩适配方法对预训练多... 面向高质量和精准烹饪的需求,提出一种基于多模态大语言模型的数字厨师与智能烹饪方法。离线阶段利用视觉、声音、温度等多源传感器记录专业厨师的连续操作,将图像与多轮问答文本融合,建立烹饪专家知识库,并采用低秩适配方法对预训练多模态大语言模型进行微调,以构建能够理解烹饪意图的多模态大语言模型。在线阶段将实时感知的数据转换为图文输入微调后的大语言模型,经模型分析后生成烹饪指令,引导用户完成相应的烹饪动作。以煎牛排任务为例,搭建了智能烹饪软硬件系统并进行实验验证。实验结果表明,经过微调后的智能烹饪系统能有效控制牛排的熟度与品质,相较于微调前的模型,显著提升了烹饪指令的合理性和针对性。 展开更多
关键词 多模态大语言模型 数字厨师 智能烹饪 烹饪机器人 专家系统 人工智能
原文传递
开源多模态大语言模型初探
5
作者 刘一闻 李彤 +2 位作者 王宇琦 李泽魁 郜婕 《中国传媒科技》 2024年第8期82-85,共4页
【目的】本文旨在总结开源多模态大语言模型(Multimodal Large Language Model,MLLM)的最新进展,探索其在新闻领域的落地实践。【方法】首先,笔者介绍了MLLM的研究背景,对典型的开源和闭源模型在不同测试基准上的表现进行了对比,然后解... 【目的】本文旨在总结开源多模态大语言模型(Multimodal Large Language Model,MLLM)的最新进展,探索其在新闻领域的落地实践。【方法】首先,笔者介绍了MLLM的研究背景,对典型的开源和闭源模型在不同测试基准上的表现进行了对比,然后解析了模型架构,包括其组成部分和工作原理,接着探讨了训练策略以及所需要的数据,最后展望了应用场景和研究方向。【结果/结论】通过本文的分析,可以了解到开源MLLM在赶超闭源商业模型上的潜力和发展方向,以及在新闻领域广阔的应用前景,同时为采编业务全流程提供强大的语言理解和生成能力,未来可以结合实际场景开展相关技术的落地实践。 展开更多
关键词 多模态大语言模型 预训练 视觉语言模型 大语言模型
下载PDF
多模态大语言模型对开源声像信息研究的影响
6
作者 吴叔義 郭秀峰 侯丽 《国防科技》 2024年第3期73-80,92,共9页
开源声像信息研究作为国防科技信息研究的组成部分,在自媒体与短视频爆发的现阶段重要性愈发凸显。大模型浪潮爆发后,深入探析多模态大语言模型对开源声像信息研究工作的影响具有重要意义。通过研究梳理多种多模态大语言模型技术特点和... 开源声像信息研究作为国防科技信息研究的组成部分,在自媒体与短视频爆发的现阶段重要性愈发凸显。大模型浪潮爆发后,深入探析多模态大语言模型对开源声像信息研究工作的影响具有重要意义。通过研究梳理多种多模态大语言模型技术特点和应用场景特点,提出在开源声像信息研究中的潜在应用方向,为开源声像信息研究工作提供参考。现阶段多模态大语言模型距离直接落地应用还有差距,但其将是重塑重构声像信息研究工作的重要推手,其生成特性也为开源声像信息研究带来极大挑战,开源声像信息研究进入转型升维的战略机遇期。 展开更多
关键词 多模态大语言模型 开源声像信息 人工智能
下载PDF
多模态大语言模型应用研究
7
作者 赵康康 《电脑与电信》 2024年第12期1-5,共5页
多模态大语言模型具备强大的信息理解与处理能力,能够实现信息的跨模态交互和推理。从模型架构、训练流程、技术进展和应用领域等方面分析其优势、不足与挑战,为今后模型优化及应用提供参考借鉴。尽管多模态大语言模型因其强大性能发展... 多模态大语言模型具备强大的信息理解与处理能力,能够实现信息的跨模态交互和推理。从模型架构、训练流程、技术进展和应用领域等方面分析其优势、不足与挑战,为今后模型优化及应用提供参考借鉴。尽管多模态大语言模型因其强大性能发展迅猛,但面临着难题,未来应不断优化模型,提高模型性能,拓宽应用领域。 展开更多
关键词 多模态大语言模型 模型架构 训练流程 技术进展 应用领域
下载PDF
多模态大语言模型应用于工业数据分类分级的初步研究与思考
8
作者 阮子禅 包宏宇 王文君 《工业信息安全》 2024年第6期43-52,共10页
在万物互联互通的时代,工业领域数据安全有其独特风险:数据平台化汇聚、工业设备平台产品漏洞未修、工业数据暴露面增加、新兴技术带来新威胁。数据分类分级作为我国数字化进程的关键一环,是帮助企业在数据安全中排列风险优先级,在策略... 在万物互联互通的时代,工业领域数据安全有其独特风险:数据平台化汇聚、工业设备平台产品漏洞未修、工业数据暴露面增加、新兴技术带来新威胁。数据分类分级作为我国数字化进程的关键一环,是帮助企业在数据安全中排列风险优先级,在策略战略制定中提供重要依据,是从存储和检索角度提高运营效率、降低成本的重要前置任务。数据分类分级方法通常涉及大量人工干预和静态分类规则。这类方法不仅耗时、人工成本高,且难以有效处理庞大多样且异构的数据集。本文提出了结合多模态大语言模型的混合模型框架,是对新兴技术应用于工业数据分类分级的初步研究与思考,旨在推动工业数据分类分级领域方法创新。 展开更多
关键词 工业领域 数据分类分级 多模态大语言模型 模型
下载PDF
基于多模态大语言模型的关系抽取研究 被引量:1
9
作者 王震宇 朱学芳 杨睿 《数据分析与知识发现》 北大核心 2025年第1期90-99,共10页
【目的】利用大语言模型生成高质量辅助知识,以提升多模态关系抽取的性能。【方法】通过引入多模态相似度检测模块构建多模态提示模板,提示大语言模型将视觉信息和先验知识融入生成的高质量辅助知识中。将获得的辅助知识与原始文本输入... 【目的】利用大语言模型生成高质量辅助知识,以提升多模态关系抽取的性能。【方法】通过引入多模态相似度检测模块构建多模态提示模板,提示大语言模型将视觉信息和先验知识融入生成的高质量辅助知识中。将获得的辅助知识与原始文本输入下游文本模型,实现对实体关系的准确预测。【结果】实验表明,相较于最优基线模型,所提模型在多模态关系抽取数据集MNRE上的准确率和F1值分别提高了4.09和7.84个百分点。【局限】实验仅基于英文数据集,未考虑其他语言数据集。【结论】通过对比实验和案例分析,验证了所提模型在多模态关系抽取任务中的有效性,为未来在多模态信息抽取任务中应用大语言模型提供了方向。 展开更多
关键词 关系抽取 多模态大语言模型 多模态预训练 上下文学习
原文传递
大语言模型在电催化领域中的应用 被引量:1
10
作者 张成翼 王兴宇 王子运 《Chinese Journal of Catalysis》 SCIE CAS CSCD 2024年第4期7-14,共8页
大语言模型作为现代科技的杰出代表,已经在社会的各个领域产生了深远影响.这些模型由数十亿个神经元相互连接构建而成,集成了人类至今为止的丰富知识,具备与全球各地人们进行流畅、精确对话的卓越能力.其类人智能特性不仅使其能够应对... 大语言模型作为现代科技的杰出代表,已经在社会的各个领域产生了深远影响.这些模型由数十亿个神经元相互连接构建而成,集成了人类至今为止的丰富知识,具备与全球各地人们进行流畅、精确对话的卓越能力.其类人智能特性不仅使其能够应对现代社会的各种挑战,更在多个科学领域中展现出巨大的应用前景.然而,目前大语言模型广泛应用的潜力尚未被完全挖掘.本文旨在深入探讨现代大语言模型在电催化领域的潜在应用,以期阐明这些人工智能驱动的模型如何助力科研人员深化对催化学科的理解,并推动催化剂的智能设计.通过对大语言模型在电催化领域应用的系统研究,我们期望能够为未来的科研工作提供新的思路和方法.本文首先分析了传统的实验法和多尺度模拟方法在催化研究中的局限性,包括资源消耗大、实验周期长、研究进展缓慢以及受人类自身能力限制等问题.随后,着重探讨了大语言模型在电催化研究中的显著优势,如突破人类认知界限、理论上具备无限知识累积能力等.尽管大语言模型展现出巨大的潜力,但仍面临泛化能力与领域专业性之间的权衡、文本限制等挑战.为应对这些挑战,本文进一步介绍了多模态大语言模型的发展及其在电催化研究中的具体应用,包括与实验者的直接互动、基于实验反馈的持续优化、预训练模型的微调以及结合视觉编码器实现多模态数据融合等.最后,强调了多模态大语言模型在光谱分析、实验路径设计、过渡状态搜索、分子结构设计、催化剂优化和问题诊断等方面的巨大潜力.总之,多模态方法在催化领域具有广泛的应用前景,能够整合多种数据源,为催化剂设计、反应机理研究和反应条件优化提供强大的工具和技术支持.最后,本文展望了大语言模型在科学研究中的作用和未来发展趋势.大语言模型在知识积累和效率提升方面展现出了出色的能力,但在创造全新知识方面,或许还无法与科学先驱相提并论.展望未来,大语言模型应当与实验和模拟方法深度融合,以增强其预测能力和多模态学习能力.通过这样的结合,大语言模型将能够更全面地辅助科学研究者,进而推动科学研究更迅速地发展.这一发展趋势不仅有助于提升科学研究的效率和准确性,还将为科学领域带来更多的创新和突破. 展开更多
关键词 大语言模型 电催化 人工智能 多模态大语言模型
下载PDF
基于SAM的零样本多模态舌体分割方法
11
作者 钟甫广 邓森耀 +3 位作者 曾军英 冯跃 钟甫东 贾旭东 《计算机科学与应用》 2025年第3期29-38,共10页
舌诊通过观察舌体特征评估健康状态,而舌体分割作为智能舌诊的关键步骤,需要准确分离舌体与背景,为后续特征提取和健康分析奠定基础。然而,舌体分割目前面临着两大挑战:一是数据的稀缺性,二是现有的分割大模型(如SAM模型)对人工提示的... 舌诊通过观察舌体特征评估健康状态,而舌体分割作为智能舌诊的关键步骤,需要准确分离舌体与背景,为后续特征提取和健康分析奠定基础。然而,舌体分割目前面临着两大挑战:一是数据的稀缺性,二是现有的分割大模型(如SAM模型)对人工提示的依赖性。为了解决以上问题,本文提出了一种零样本多模态的分割方法。该方法结合SAM模型和多模态提示技术,通过两阶段框架实现:1) 初步分割和相似度聚类,利用SAM模型生成初步分割结果,并通过相似度聚类解码器筛选潜在有效分割;2) 精细化分割,利用多模态大语言模型分析舌体特征,生成精确点提示,再次输入到SAM模型中以实现高精度分割。该方法在无需特定任务训练或标注数据的情况下,实现了SAM模型在舌诊领域的智能分割应用。实验结果显示,相比于原始的SAM模型,该方法在三个舌诊数据集上的mIoU指标分别提升了27.3%,18.2%,29.7%。Tongue diagnosis assesses health status by observing tongue characteristics, and tongue segmentation, as a key step in intelligent tongue diagnosis, requires accurately separating the tongue body from the background to lay a foundation for subsequent feature extraction and health analysis. However, tongue segmentation currently faces two main challenges: data scarcity and the dependency of existing large segmentation models (such as the segment anything model) on manual prompts. To address these issues, this paper proposes a zero-shot multimodal segmentation method. This method combines the SAM model with multimodal prompt techniques and implemented in a two-stage framework: 1) initial segmentation and similarity clustering, where the SAM model generates initial segmentation results, followed by a similarity clustering decoder to filter out potentially effective segmentations;2) refined segmentation, where a multimodal large language model analyzes tongue characteristics to generate precise point prompts, which are re-entered into the SAM model to achieve high-precision segmentation. This method enables intelligent segmentation with the SAM model in tongue diagnosis without the need for task-specific training or annotated data. Experimental results show that, compared to the original SAM model, this method improves the mIoU metric on three tongue diagnosis datasets by 27.3%, 18.2%, and 29.7%, respectively. 展开更多
关键词 舌体分割 零样本学习 多模态大语言模型 相似度聚类 医学图像处理
下载PDF
图表问答研究综述
12
作者 马秋平 张琪 赵晓凡 《数据与计算发展前沿(中英文)》 2025年第1期19-37,共19页
【目的】本文旨在全面综述图表问答(CQA)技术的研究进展,分析现有模型和方法,并探讨未来发展方向。【方法】首先将CQA模型分为两大类:基于深度学习和基于多模态大模型。针对基于深度学习的方法,本文进一步细分为端到端模型和两阶段模型... 【目的】本文旨在全面综述图表问答(CQA)技术的研究进展,分析现有模型和方法,并探讨未来发展方向。【方法】首先将CQA模型分为两大类:基于深度学习和基于多模态大模型。针对基于深度学习的方法,本文进一步细分为端到端模型和两阶段模型。随后,深入分析了基于深度学习的CQA任务的三个核心流程,并对各个流程现有的处理方法进行了详细的分类和深入的分析。本文还探讨了基于多模态大模型的CQA模型,分析了其优势、局限性以及未来发展方向。【结果】本文全面总结了CQA技术的研究现状,并对现有模型和方法进行了深入分析。本文发现,基于深度学习的CQA模型在处理标准图表类型和简单任务时表现优异,但在面对复杂、非标准化图表或需要深度推理的任务时仍显不足。而基于多模态大模型的CQA模型则展现出巨大的潜力,但模型性能的提升往往伴随着模型规模和计算复杂度的增加。未来研究应聚焦于开发更轻量化的问答模型,并提升模型的可解释性。 展开更多
关键词 图表问答 视觉问答 深度学习 多模态大语言模型
下载PDF
GPT-4模型的已知风险、控制策略及其启示
13
作者 韩秋明 《中国科技人才》 2023年第6期57-62,共6页
对OpenAI发布的技术文件深入分析,发现GPT-4大语言模型存在3类12种风险,分别是对人的误导(幻觉、虚假信息、有害内容、用户过度依赖)、对社会秩序的挑战(社会偏见、侵犯隐私、破坏网络安全、与其他系统交互进行“算法合谋”、主动寻求资... 对OpenAI发布的技术文件深入分析,发现GPT-4大语言模型存在3类12种风险,分别是对人的误导(幻觉、虚假信息、有害内容、用户过度依赖)、对社会秩序的挑战(社会偏见、侵犯隐私、破坏网络安全、与其他系统交互进行“算法合谋”、主动寻求资源)以及对国家经济和安全的影响(劳动力替代、常规和非常规武器扩散、加速国家竞争)。本文总结OpenAI采取的多种风险防控举措,如制定严格的使用规则、数据集和预训练后干预,设置细粒度个性化的内容分类器,以及寻找漏洞的“赏金猎人计划”等,并进一步提出对生成式人工智能采取分层治理、对大语言模型进行较长时间(半年以上)的对抗性测试以及细化合规免责制度以给新兴技术发展留下试错空间等建议。 展开更多
关键词 ChatGPT GPT-4 多模态大语言模型 生成式人工智能 风险防控
下载PDF
平行旅游:基础智能驱动的智慧出游服务 被引量:2
14
作者 张腾超 田永林 +7 位作者 林飞 倪清桦 宋平 戴星原 李娟娟 伍乃騏 Timothy J.Lee 王飞跃 《智能科学与技术学报》 CSCD 2024年第2期164-178,共15页
旅游作为一种满足人们对不同生活体验和知识需求的活动,对经济、文化等领域都产生了深远影响。随着物联网、多模态大语言模型等技术的迅速发展,传统的旅游业难以满足人们智能化以及个性化的旅游需求。为此,以平行智能为理念,基于ACP方... 旅游作为一种满足人们对不同生活体验和知识需求的活动,对经济、文化等领域都产生了深远影响。随着物联网、多模态大语言模型等技术的迅速发展,传统的旅游业难以满足人们智能化以及个性化的旅游需求。为此,以平行智能为理念,基于ACP方法与多模态大语言模型提出了虚实交互的个性化旅游服务系统,通过构建旅游大模型,并结合检索增强生成方法和多智能体协作系统,打造个性化旅游服务的新范式。此外,探讨了平行旅游的应用生态,从“行”“住”“食”“衣”4个方面对整个旅游生态进行拓展,分析了其他行业与个性化旅游服务的融合。平行旅游将为旅游行服务业的发展带来全新可能。 展开更多
关键词 平行旅游 平行系统 ACP方法 多模态大语言模型 检索增强生成 元宇宙
原文传递
人工智能驱动慢性阻塞性肺疾病精准诊疗研究进展
15
作者 朱子锐 曾卓 +1 位作者 曾惠清 罗雄彪 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期894-905,共12页
[背景]慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是一种全球常见的慢性呼吸系统疾病,其早期精准诊断和治疗对患者生活质量有着重大影响.近年来,人工智能(artificial intelligence,AI)技术在医疗领域的快速发展,为C... [背景]慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是一种全球常见的慢性呼吸系统疾病,其早期精准诊断和治疗对患者生活质量有着重大影响.近年来,人工智能(artificial intelligence,AI)技术在医疗领域的快速发展,为COPD早期精准诊疗开辟了新的思路.[进展]本文梳理了AI技术在COPD诊疗中的应用现状,尤其是AI单模态和多模态模型的应用研究进展.单模态模型专注于单一类型的数据源,显示了其早期诊断和监测能力;而多模态模型通过融合来自医学影像、生物医学数据、电子病历等多源信息,进一步提升了对COPD患者病情的全面理解和个性化精准治疗,具有更加广阔的应用前景.[展望]AI技术在COPD早期诊断、区分疾病严重程度、预测急性加重、治疗、管理监测及康复等方面展示出独特的优势.尤其是当前通用AI、生成式AI以及多模态大语言模型等前沿AI技术的快速发展,必将大力促进医生更加精确地诊断疾病,制定更加个性化的患者治疗方案,大幅度地提高临床治疗效果和患者生活质量. 展开更多
关键词 慢性阻塞性肺疾病 人工智能 模态数据 多模态数据 生成式人工智能 通用人工智能 多模态大语言模型 呼吸病学 精准医学
下载PDF
铁路局集团公司运输调度安全管理关键技术及应用研究 被引量:1
16
作者 宋蔚峰 冯小芳 《铁道货运》 2024年第9期27-36,共10页
铁路运输调度指挥过程中的安全管理是守好铁路运输安全的第一道大门,铁路调度指挥音视频安全检查和数据检索分析等调度安全管理的核心工作还主要依靠手动方式来完成,亟需利用新技术、新应用提升调度安全管理的效率和水平。首先研究智能... 铁路运输调度指挥过程中的安全管理是守好铁路运输安全的第一道大门,铁路调度指挥音视频安全检查和数据检索分析等调度安全管理的核心工作还主要依靠手动方式来完成,亟需利用新技术、新应用提升调度安全管理的效率和水平。首先研究智能语音分析、智能视频分析和多模态大语言模型等关键技术并设计其在调度安全管理中的应用技术路线;其次分析构建铁路调度指挥安全管理应用需要实现的业务目标;最后按照业务目标要求,详细设计调度人员及安全风险管理、调度语音识别、调度用语考核、调度安全监测、“调度问询”小程序等主要功能。基于人工智能AI音视频分析和多模态大语言模型为铁路智能调度安全管理应用注入新活力,可有效提升调度安全考核、主动监测和智能搜索能力。 展开更多
关键词 语音识别 视频分析 多模态大语言模型 铁路运输调度安全管理 风险管理
下载PDF
基于光片荧光显微镜的三维病理分析综述(特邀)
17
作者 费鹏 思文天 张敏超 《光学学报(网络版)》 2024年第5期18-37,共20页
荧光显微镜是生物医学研究中的重要工具,通过使用荧光染料或荧光蛋白标记特定的细胞或分子,使其在显微镜下发出荧光,从而实现高分辨率成像。光片荧光显微镜是一种新兴的三维成像技术,通过快速扫描薄片样本实现高通量、高分辨率的三维成... 荧光显微镜是生物医学研究中的重要工具,通过使用荧光染料或荧光蛋白标记特定的细胞或分子,使其在显微镜下发出荧光,从而实现高分辨率成像。光片荧光显微镜是一种新兴的三维成像技术,通过快速扫描薄片样本实现高通量、高分辨率的三维成像,具有光漂白与光毒性低、光子利用效率高、成像速度快和分辨率高等优点,广泛应用于神经科学、细胞生物学、病理学等生物医学领域。相比于传统的二维病理切片,三维病理分析能够提供组织结构的完整空间信息,有助于更全面地理解疾病的发生和发展机制,而三维病理分析领域的发展,将极大地推动病理学研究的深入和临床诊断的精确化,为疾病的早期发现、精准治疗和个性化医疗提供强有力的支持。本文首先介绍光片显微成像技术的发展及其在病理领域的应用,然后介绍目前三维病理分析的主要工作和方法,并着重讨论新兴的多模态大语言模型在病理分析领域的应用前景。 展开更多
关键词 光片荧光显微镜 三维成像 生物医学 病理分析 多模态大语言模型
下载PDF
AIGC军事大模型评估体系框架研究
18
作者 张龙 王数 +2 位作者 雷震 冯轩铭 杨波 《战术导弹技术》 北大核心 2025年第1期42-52,共11页
生成式人工智能(AI-Generated Content,AIGC)关键技术突破推动多模态大语言模型(Multimodal Large Language Models,MLLMs)军事垂直领域应用过程中存在评估体系评估指标不够健全的问题,为解决此问题,采用自顶向下正向设计与自底向上聚... 生成式人工智能(AI-Generated Content,AIGC)关键技术突破推动多模态大语言模型(Multimodal Large Language Models,MLLMs)军事垂直领域应用过程中存在评估体系评估指标不够健全的问题,为解决此问题,采用自顶向下正向设计与自底向上聚合评估相结合的方法,构建包含智能化军事需求—智能化场景任务—系统性能评估—体系效能评估的“四域”,与基础支撑服务—算法指标体系—综合安全防护的“三维”军事大模型评估体系框架,提出评估大模型的主要维度、关键指标和基本流程,并定性定量相结合给出相应评估指标体系,为军事大模型赋能装备体系和作战效能提供评估支撑。 展开更多
关键词 生成式人工智能(AIGC) 多模态大语言模型(MLLMs) 军事大模型 智能化 评估 体系效能 体系框架
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部