AI 时代,应用创造世界?
AI 应用时代,真的来了吗? 今年的百度世界大会主题是「应用来了」——截至 11 月初,百度文心大模型的日均调用量已经超过 15 亿,相较一年前首次披露的 5000 万次,增长约 30 倍。李彦宏表示,「这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。」 而智能体作为 AI 应用的最主流形态,即将迎来爆发点,李彦宏强调,「它将成为 AI 原生时代,内容、信息和服务的新载体。」 这是因为,「一方面,做智能体的门槛足够低;另一方面,智能体的天花板又足够的高,可以做出功能非常强大的应用。多个智能体的协作,还可以解决更加复杂的问题。」 李彦宏在会上展示了 4 种不同类型的智能体,包括公司类智能体,角色类智能体,工具类智能体和行业类智能体。其中,公司官方智能体很可能替代官网,成为最直接面向消费者的界面。 「公司类智能体相当于 AI 时代的公司官网。传统官网具有的那些能力,比如公司介绍、产品图片和参数展示、线下门店位置等等,公司类智能体都有。而传统网站没有的主动推荐、及时响应和一对一服务能力,公司智能体也有。」 李彦宏还发布了无代码工具「秒哒」——一个由大模型和智能体组成的、不需要写代码就能够实现任意想法的软件,包括无代码编程、多智能体协作以及规模化地调用各种工具等能力,是「迄今为止人类历史上最复杂的多智能体协作工具」。 借助「秒哒」,用户可以通过自然语言交互完成整套系统的搭建,还可以做任意场景下的各种应用,随着基础模型能力提升,以及秒哒本身技术能力的演进,未来可以做更多、更复杂的事情,「这意味着,你不需要去招募项目经理、设计人员、开发人员、测试人员等等,自己就可以指挥多个智能体来协同完成任务」,一个人可以是一整支队伍。 用李彦宏的话来说,有了秒哒,将迎来一个「只靠想法就能赚钱的时代」。 文库与网盘融合:更自由地创作 继 9 月百度网盘的 C 端业务重新划归移动生态事业群组(MEG),并由百度副总裁、百度文库&百度网盘负责人王颖接手管理后,在本次世界大会上,百度网盘和文库又有了进一步融合。 王颖在大会上分享了百度在内容生产和消费方面的一些新变革。她谈到,当前内容创作和消费面临诸多挑战,如工具繁杂、制作周期长和消费效率低。为此,百度文库和网盘引入了 AI 技术,旨在打破工具束缚和模态边界,实现更自由、高效的内容体验。 百度文库推出的智能 PPT 生成、AI 论文创作、AI 画本制作、AI 搜索能力和 AI 小说漫画生成等功能显著提升了内容生产的效率和质量;同时,在内容消费方面,百度网盘推出了简单扫描、简单听记和 AI 视频摘要等工具,极大地方便了用户处理和理解信息。 具体来看,在办公场景中,百度文库提供了智能 PPT 和智能研报功能,百度网盘则具备简单听记等功能;在学习场景下,用户可以使用百度文库的智能画本和拍图搜题功能,百度网盘则提供视频解读和盘盘单词等辅助学习工具;在娱乐方面,百度文库提供智能小说和智能漫画,百度网盘则具备 AI 修图等功能。百度文库与网盘的融合拓宽了用户的应用场景,实现了内容的智能化和多样化,进一步提升了用户体验。 自由画布功能|图片来源:百度 此外,百度文库与网盘联合推出了全新的内容操作系统——自由画布。这一系统可以帮用户完成从找资料、到编辑、再到生成和分享的全部任务,不仅支持全格式输入和多种模态的输出,还能实现元素级别的内容利用,丰富了创作和分享的自由度。 用李彦宏的话说,「自由画布就是一个由文心多模态大模型加持的万能白板」。这些创新不仅展示了 AI 技术在内容领域的巨大潜力,也预示着内容生产和消费未来有更多可能性。 智能云:从技术变革走向产业变革 在大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖分享了百度智能云在大模型和 AI 原生应用方面的最新进展。沈抖称,大模型技术正在从技术变革走向产业变革,重新定义人与数字世界及物理世界的交互方式,成为企业提升竞争力的关键要素。 沈抖重点谈到了千帆平台,这是一个大模型精调和应用开发的平台,提供丰富的工具链,显著降低了 AI 原生应用开发的门槛。千帆平台不仅满足了企业级应用的高度可定制化、大规模、高可用性和高安全性需求,还发布了工作流 Agent。这一创新利用大模型的意图理解和泛化能力,将复杂的工作流程变成灵活的智能体,大幅提升企业效率。例如,太平洋保险利用千帆平台生成「金牌销售」智能体,显著提升了车险续保的服务效率和用户体验。 百度智能云千帆|图片来源:百度 此外,百舸平台提供高效的大模型相关算力服务,从集群创建到模型训练和推理,确保稳定、极速的性能。该平台解决了大规模集群部署中的关键难题,支持高效运行,满足不同客户的算力需求。 沈抖还展示了千帆平台在多个行业中的应用案例,包括全诊医学通过精调模型提升病历生成准确度,节省医生时间;国家电网基于文心大模型探索电力行业的 AI 应用,取得显著成果。此外,曦灵 4.0 平台的升级使其能够生成 3D 数字人形象并制作专业视频,大幅降低了短视频制作成本。 百度智能云通过千帆和百舸平台,构建了新型 AI 基础设施,推动了大模型技术在各行各业的应用,以提升企业的智能化水平和效率。 小度 AI 眼镜:首搭中文大模型 除了应用,百度这次在硬件上也有所发布。在会上,百度集团副总裁、小度科技 CEO 李莹发布了「首款搭载中文大模型的原生 AI 眼镜」——小度 AI 眼镜。 小度AI眼镜|图片来源:百度 李莹称,AI 眼镜作为人类的第一视角设备,其捕捉视觉、声音、位置等信息的能力,将给人们带来前所未有的感官延伸,也一定会成为更高效、便捷的人机交互入口。 基于文心大模型和 DuerOS AI 原生操作系统,小度 AI 可实现备第一视角拍摄、边走边问、卡路里识别、识物百科、视听翻译、智能备忘等功能。 通过端云结合大模型,小度 AI 眼镜可以独立使用也可以搭配 APP,眼镜内置中文单行,可实时回复用户的提问。 硬件方面,小度 AI 眼镜搭载四麦克风阵列识别声音,采用开放式防漏音扬声器设计,搭载 1600 万像素超广角镜头和 AI 防抖算法;30min 即可充满电,实现 56 小时待机,超 5 小时连续聆听;整机重量仅为 45 克,低于行业平均的 49 克。 预计小度 AI 眼镜将在明年上半年上市销售,售价尚未公布,不过展台工作人员表示,价格可能在 2000 元左右。 AI 应用的繁荣时期即将到来? 李彦宏在会上谈到,在过去 24 个月里,AI 行业发生了显著的变化,其中最为突出的是大模型基本消除了幻觉现象。这一变化使得 AI 从最初的「一本正经的胡说八道」变得可用且可信赖。大模型本质上是一个概率模型,其生成的内容具有一定的不确定性。然而,通过采用 RAG 技术,大模型能够利用检索到的信息来指导文本或答案的生成,从而显著提高了内容的质量和准确性。 为了解决图像生成中的幻觉问题,百度在今年年初开发了一项技术——iRAG(Image based RAG),即检索增强的文生图技术。在此之前,完全基于大语言模型的文生图系统生成的图片往往质量低劣,甚至逻辑不合常理。百度的 iRAG 技术结合了百度搜索的亿级图片资源和强大的基础模型能力,能够生成各种超真实的图片,整体效果远超文生图原生系统,消除了机器生成的痕迹。 随着 AI 生成图片的可用性大幅提高,其应用空间也得到了极大的拓展。例如,在品牌宣传场景中,以前制作一组海报可能需要投入数十万元,而现在创作成本几乎为零。简而言之,iRAG 的商业价值体现在无幻觉、超真实、低成本和即时可得等方面。 李彦宏在大会现场|图片来源:百度 当基础模型能力成熟时,AI 应用的繁荣时期也即将到来。那么,AI 应用从何而来,又将走向何方?主要有两大方向:一是智能体,二是产业应用。 在未来,或许当 AI 应用的繁荣时期真正到来时,AI 也能真正实现它「产业革命级机会」的使命,为社会经济带来生产力的无限扩张。
AI 应用时代,真的来了吗?
今年的百度世界大会主题是「应用来了」——截至 11 月初,百度文心大模型的日均调用量已经超过 15 亿,相较一年前首次披露的 5000 万次,增长约 30 倍。李彦宏表示,「这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。」
而智能体作为 AI 应用的最主流形态,即将迎来爆发点,李彦宏强调,「它将成为 AI 原生时代,内容、信息和服务的新载体。」
这是因为,「一方面,做智能体的门槛足够低;另一方面,智能体的天花板又足够的高,可以做出功能非常强大的应用。多个智能体的协作,还可以解决更加复杂的问题。」
李彦宏在会上展示了 4 种不同类型的智能体,包括公司类智能体,角色类智能体,工具类智能体和行业类智能体。其中,公司官方智能体很可能替代官网,成为最直接面向消费者的界面。
「公司类智能体相当于 AI 时代的公司官网。传统官网具有的那些能力,比如公司介绍、产品图片和参数展示、线下门店位置等等,公司类智能体都有。而传统网站没有的主动推荐、及时响应和一对一服务能力,公司智能体也有。」
李彦宏还发布了无代码工具「秒哒」——一个由大模型和智能体组成的、不需要写代码就能够实现任意想法的软件,包括无代码编程、多智能体协作以及规模化地调用各种工具等能力,是「迄今为止人类历史上最复杂的多智能体协作工具」。
借助「秒哒」,用户可以通过自然语言交互完成整套系统的搭建,还可以做任意场景下的各种应用,随着基础模型能力提升,以及秒哒本身技术能力的演进,未来可以做更多、更复杂的事情,「这意味着,你不需要去招募项目经理、设计人员、开发人员、测试人员等等,自己就可以指挥多个智能体来协同完成任务」,一个人可以是一整支队伍。
用李彦宏的话来说,有了秒哒,将迎来一个「只靠想法就能赚钱的时代」。
文库与网盘融合:更自由地创作
继 9 月百度网盘的 C 端业务重新划归移动生态事业群组(MEG),并由百度副总裁、百度文库&百度网盘负责人王颖接手管理后,在本次世界大会上,百度网盘和文库又有了进一步融合。
王颖在大会上分享了百度在内容生产和消费方面的一些新变革。她谈到,当前内容创作和消费面临诸多挑战,如工具繁杂、制作周期长和消费效率低。为此,百度文库和网盘引入了 AI 技术,旨在打破工具束缚和模态边界,实现更自由、高效的内容体验。
百度文库推出的智能 PPT 生成、AI 论文创作、AI 画本制作、AI 搜索能力和 AI 小说漫画生成等功能显著提升了内容生产的效率和质量;同时,在内容消费方面,百度网盘推出了简单扫描、简单听记和 AI 视频摘要等工具,极大地方便了用户处理和理解信息。
具体来看,在办公场景中,百度文库提供了智能 PPT 和智能研报功能,百度网盘则具备简单听记等功能;在学习场景下,用户可以使用百度文库的智能画本和拍图搜题功能,百度网盘则提供视频解读和盘盘单词等辅助学习工具;在娱乐方面,百度文库提供智能小说和智能漫画,百度网盘则具备 AI 修图等功能。百度文库与网盘的融合拓宽了用户的应用场景,实现了内容的智能化和多样化,进一步提升了用户体验。
自由画布功能|图片来源:百度
此外,百度文库与网盘联合推出了全新的内容操作系统——自由画布。这一系统可以帮用户完成从找资料、到编辑、再到生成和分享的全部任务,不仅支持全格式输入和多种模态的输出,还能实现元素级别的内容利用,丰富了创作和分享的自由度。
用李彦宏的话说,「自由画布就是一个由文心多模态大模型加持的万能白板」。这些创新不仅展示了 AI 技术在内容领域的巨大潜力,也预示着内容生产和消费未来有更多可能性。
智能云:从技术变革走向产业变革
在大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖分享了百度智能云在大模型和 AI 原生应用方面的最新进展。沈抖称,大模型技术正在从技术变革走向产业变革,重新定义人与数字世界及物理世界的交互方式,成为企业提升竞争力的关键要素。
沈抖重点谈到了千帆平台,这是一个大模型精调和应用开发的平台,提供丰富的工具链,显著降低了 AI 原生应用开发的门槛。千帆平台不仅满足了企业级应用的高度可定制化、大规模、高可用性和高安全性需求,还发布了工作流 Agent。这一创新利用大模型的意图理解和泛化能力,将复杂的工作流程变成灵活的智能体,大幅提升企业效率。例如,太平洋保险利用千帆平台生成「金牌销售」智能体,显著提升了车险续保的服务效率和用户体验。
百度智能云千帆|图片来源:百度
此外,百舸平台提供高效的大模型相关算力服务,从集群创建到模型训练和推理,确保稳定、极速的性能。该平台解决了大规模集群部署中的关键难题,支持高效运行,满足不同客户的算力需求。
沈抖还展示了千帆平台在多个行业中的应用案例,包括全诊医学通过精调模型提升病历生成准确度,节省医生时间;国家电网基于文心大模型探索电力行业的 AI 应用,取得显著成果。此外,曦灵 4.0 平台的升级使其能够生成 3D 数字人形象并制作专业视频,大幅降低了短视频制作成本。
百度智能云通过千帆和百舸平台,构建了新型 AI 基础设施,推动了大模型技术在各行各业的应用,以提升企业的智能化水平和效率。
小度 AI 眼镜:首搭中文大模型
除了应用,百度这次在硬件上也有所发布。在会上,百度集团副总裁、小度科技 CEO 李莹发布了「首款搭载中文大模型的原生 AI 眼镜」——小度 AI 眼镜。
小度AI眼镜|图片来源:百度
李莹称,AI 眼镜作为人类的第一视角设备,其捕捉视觉、声音、位置等信息的能力,将给人们带来前所未有的感官延伸,也一定会成为更高效、便捷的人机交互入口。
基于文心大模型和 DuerOS AI 原生操作系统,小度 AI 可实现备第一视角拍摄、边走边问、卡路里识别、识物百科、视听翻译、智能备忘等功能。
通过端云结合大模型,小度 AI 眼镜可以独立使用也可以搭配 APP,眼镜内置中文单行,可实时回复用户的提问。
硬件方面,小度 AI 眼镜搭载四麦克风阵列识别声音,采用开放式防漏音扬声器设计,搭载 1600 万像素超广角镜头和 AI 防抖算法;30min 即可充满电,实现 56 小时待机,超 5 小时连续聆听;整机重量仅为 45 克,低于行业平均的 49 克。
预计小度 AI 眼镜将在明年上半年上市销售,售价尚未公布,不过展台工作人员表示,价格可能在 2000 元左右。
AI 应用的繁荣时期即将到来?
李彦宏在会上谈到,在过去 24 个月里,AI 行业发生了显著的变化,其中最为突出的是大模型基本消除了幻觉现象。这一变化使得 AI 从最初的「一本正经的胡说八道」变得可用且可信赖。大模型本质上是一个概率模型,其生成的内容具有一定的不确定性。然而,通过采用 RAG 技术,大模型能够利用检索到的信息来指导文本或答案的生成,从而显著提高了内容的质量和准确性。
为了解决图像生成中的幻觉问题,百度在今年年初开发了一项技术——iRAG(Image based RAG),即检索增强的文生图技术。在此之前,完全基于大语言模型的文生图系统生成的图片往往质量低劣,甚至逻辑不合常理。百度的 iRAG 技术结合了百度搜索的亿级图片资源和强大的基础模型能力,能够生成各种超真实的图片,整体效果远超文生图原生系统,消除了机器生成的痕迹。
随着 AI 生成图片的可用性大幅提高,其应用空间也得到了极大的拓展。例如,在品牌宣传场景中,以前制作一组海报可能需要投入数十万元,而现在创作成本几乎为零。简而言之,iRAG 的商业价值体现在无幻觉、超真实、低成本和即时可得等方面。
李彦宏在大会现场|图片来源:百度
当基础模型能力成熟时,AI 应用的繁荣时期也即将到来。那么,AI 应用从何而来,又将走向何方?主要有两大方向:一是智能体,二是产业应用。
在未来,或许当 AI 应用的繁荣时期真正到来时,AI 也能真正实现它「产业革命级机会」的使命,为社会经济带来生产力的无限扩张。