齐鲁晚报.齐鲁壹点王赟
2025年世界人工智能大会(WAIC)密密麻麻的论坛日程中,7月27日有名曰“从通用智力到专业生产力:高阶程序引领的AI应用新范式”的一场论坛。
这场论坛上有两位嘉宾多频使用一个词——幻觉。
论坛上,浙江大学教授、区块链与数据安全全国重点实验室主任陈纯表示,大模型的专业化应用,首当其冲的是可靠性问题。尽管当前技术SOTA已经到了80%到90%的水平,但其可靠性距离医疗、工业、金融等专业场景的要求仍有显著差距。陈纯说,有人将这一问题简单归结为“幻觉”,“但我想强调:幻觉是智力的必然代价。若消除所有幻觉,大模型将退化为机械的检索工具。”因此,可靠性的突破不在于消灭“智力特征”,而在于构建工程化保障框架。
论坛上,蚂蚁集团旗下蚂蚁密算宣布对外开源高阶程序(High-OrderProgram)大模型可信应用技术框架,蚂蚁集团副总裁、蚂蚁密算董事长韦韬在阐述中也提到“幻觉”,要突破大模型在专业化应用中的可靠性困境,技术上不应当只依赖于大模型“十全十美”不犯错,而是通过智能体系和工程体系的结合,实现专业应用可靠性的保障。正如每个人作为个体,是容易犯错、容易有幻觉的,但人类几千年以来不断在工程体系上的进步,能够在易错的个体之上构建庞大而可靠的工程体系,完成诸如登月、探访火星等巨型任务。他提出,通过全新的程序表达、场景知识嵌入和闭环核验反馈机制,可以将大模型不确定的智力输出转化为可信的专业生产力。
齐鲁晚报.齐鲁壹点了解到,蚂蚁密算开源HOP框架,用工程化思维将专家经验、领域知识与多重核验融合,像新能源车电控系统般确保AI执行精准度,已在金融风控、医疗计费场景验证效果。
以金融联合风控为例,在传统金融风控体系下,从数据探查、处理到模型构建与调优的全链路操作,高度依赖人工干预,导致流程冗长、响应缓慢,并且容易受人员主观因素影响,制约了金融风控联合建模的效率与一致性。在应用HOP技术框架后,将复杂的SOP转化为可执行的流程和代码,实现风控全链路的智能化编排与自动化执行。相较于传统建模人员手动进行数据分析和代码开发,大模型结合HOP能够在确保高精度的同时缩短建模周期,并显著减少了重复性数据处理和流程执行等繁琐的基础工作。这不但能降低处理成本,还能够缓解专业人才紧缺的局面。
韦韬用新能源车来比喻今天的大模型产业应用,大模型相当于新能源车的电机系统,是通用的智力引擎,而整个可靠性保障其实要靠电控部分,“之前不可靠大家怪发动机。我们觉得高阶程序是很好的控制体系,能有效承担行业AI应用电控部分的智能。电池部分是数据。未来行业AI应用,核心就是数据、智能模型和高阶程序,支撑起整个行业AI变革。”
在此,再思考陈纯说的话,幻觉并非要被“赶尽杀绝”的负面元素。
陈纯称,模型的幻觉,恰恰是人工智能系统智能水平发展到一定高度的产物。若消除所有幻觉,大模型将退化为机械的检索工具。韦韬则以元素周期表和苯环结构发现为例,认为人类智能里非逻辑性跳跃的思维方式与幻觉类似,但它曾经显著推进了人类文明的进程。
如果幻觉不应成为产业端应用的问题,大模型在高准确度场景里规模应用解法在哪?陈纯认为,可靠性的突破不在于消灭“智力特征”,而在于构建工程化保障框架。
韦韬也指出,“现在有一些不太好的思潮,把智能化和工程化对立了,任务解决问题的思路没有放在模型端,就显得没那么智能。”应该借鉴人类智能的经验,以智能化叠加工程化国内最安全的股票配资平台,确保在高可靠性要求场景里的大模型可信应用。
鼎泽配资提示:文章来自网络,不代表本站观点。