专栏

AI 时代，应用创造世界？

AI 应用时代，真的来了吗？今年的百度世界大会主题是「应用来了」——截至 11 月初，百度文心大模型的日均调用量已经超过 15 亿，相较一年前首次披露的 5000 万次，增长约 30 倍。李彦宏表示，「这条陡峭的增长曲线，代表着过去两年中国大模型应用的爆发。」而智能体作为 AI 应用的最主流形态，即将迎来爆发点，李彦宏强调，「它将成为 AI 原生时代，内容、信息和服务的新载体。」这是因为，「一方面，做智能体的门槛足够低；另一方面，智能体的天花板又足够的高，可以做出功能非常强大的应用。多个智能体的协作，还可以解决更加复杂的问题。」李彦宏在会上展示了 4 种不同类型的智能体，包括公司类智能体，角色类智能体，工具类智能体和行业类智能体。其中，公司官方智能体很可能替代官网，成为最直接面向消费者的界面。「公司类智能体相当于 AI 时代的公司官网。传统官网具有的那些能力，比如公司介绍、产品图片和参数展示、线下门店位置等等，公司类智能体都有。而传统网站没有的主动推荐、及时响应和一对一服务能力，公司智能体也有。」李彦宏还发布了无代码工具「秒哒」——一个由大模型和智能体组成的、不需要写代码就能够实现任意想法的软件，包括无代码编程、多智能体协作以及规模化地调用各种工具等能力，是「迄今为止人类历史上最复杂的多智能体协作工具」。借助「秒哒」，用户可以通过自然语言交互完成整套系统的搭建，还可以做任意场景下的各种应用，随着基础模型能力提升，以及秒哒本身技术能力的演进，未来可以做更多、更复杂的事情，「这意味着，你不需要去招募项目经理、设计人员、开发人员、测试人员等等，自己就可以指挥多个智能体来协同完成任务」，一个人可以是一整支队伍。用李彦宏的话来说，有了秒哒，将迎来一个「只靠想法就能赚钱的时代」。文库与网盘融合：更自由地创作继 9 月百度网盘的 C 端业务重新划归移动生态事业群组（MEG），并由百度副总裁、百度文库&百度网盘负责人王颖接手管理后，在本次世界大会上，百度网盘和文库又有了进一步融合。王颖在大会上分享了百度在内容生产和消费方面的一些新变革。她谈到，当前内容创作和消费面临诸多挑战，如工具繁杂、制作周期长和消费效率低。为此，百度文库和网盘引入了 AI 技术，旨在打破工具束缚和模态边界，实现更自由、高效的内容体验。百度文库推出的智能 PPT 生成、AI 论文创作、AI 画本制作、AI 搜索能力和 AI 小说漫画生成等功能显著提升了内容生产的效率和质量；同时，在内容消费方面，百度网盘推出了简单扫描、简单听记和 AI 视频摘要等工具，极大地方便了用户处理和理解信息。具体来看，在办公场景中，百度文库提供了智能 PPT 和智能研报功能，百度网盘则具备简单听记等功能；在学习场景下，用户可以使用百度文库的智能画本和拍图搜题功能，百度网盘则提供视频解读和盘盘单词等辅助学习工具；在娱乐方面，百度文库提供智能小说和智能漫画，百度网盘则具备 AI 修图等功能。百度文库与网盘的融合拓宽了用户的应用场景，实现了内容的智能化和多样化，进一步提升了用户体验。自由画布功能｜图片来源：百度此外，百度文库与网盘联合推出了全新的内容操作系统——自由画布。这一系统可以帮用户完成从找资料、到编辑、再到生成和分享的全部任务，不仅支持全格式输入和多种模态的输出，还能实现元素级别的内容利用，丰富了创作和分享的自由度。用李彦宏的话说，「自由画布就是一个由文心多模态大模型加持的万能白板」。这些创新不仅展示了 AI 技术在内容领域的巨大潜力，也预示着内容生产和消费未来有更多可能性。智能云：从技术变革走向产业变革在大会上，百度集团执行副总裁、百度智能云事业群总裁沈抖分享了百度智能云在大模型和 AI 原生应用方面的最新进展。沈抖称，大模型技术正在从技术变革走向产业变革，重新定义人与数字世界及物理世界的交互方式，成为企业提升竞争力的关键要素。沈抖重点谈到了千帆平台，这是一个大模型精调和应用开发的平台，提供丰富的工具链，显著降低了 AI 原生应用开发的门槛。千帆平台不仅满足了企业级应用的高度可定制化、大规模、高可用性和高安全性需求，还发布了工作流 Agent。这一创新利用大模型的意图理解和泛化能力，将复杂的工作流程变成灵活的智能体，大幅提升企业效率。例如，太平洋保险利用千帆平台生成「金牌销售」智能体，显著提升了车险续保的服务效率和用户体验。百度智能云千帆｜图片来源：百度此外，百舸平台提供高效的大模型相关算力服务，从集群创建到模型训练和推理，确保稳定、极速的性能。该平台解决了大规模集群部署中的关键难题，支持高效运行，满足不同客户的算力需求。沈抖还展示了千帆平台在多个行业中的应用案例，包括全诊医学通过精调模型提升病历生成准确度，节省医生时间；国家电网基于文心大模型探索电力行业的 AI 应用，取得显著成果。此外，曦灵 4.0 平台的升级使其能够生成 3D 数字人形象并制作专业视频，大幅降低了短视频制作成本。百度智能云通过千帆和百舸平台，构建了新型 AI 基础设施，推动了大模型技术在各行各业的应用，以提升企业的智能化水平和效率。小度 AI 眼镜：首搭中文大模型除了应用，百度这次在硬件上也有所发布。在会上，百度集团副总裁、小度科技 CEO 李莹发布了「首款搭载中文大模型的原生 AI 眼镜」——小度 AI 眼镜。小度AI眼镜｜图片来源：百度李莹称，AI 眼镜作为人类的第一视角设备，其捕捉视觉、声音、位置等信息的能力，将给人们带来前所未有的感官延伸，也一定会成为更高效、便捷的人机交互入口。基于文心大模型和 DuerOS AI 原生操作系统，小度 AI 可实现备第一视角拍摄、边走边问、卡路里识别、识物百科、视听翻译、智能备忘等功能。通过端云结合大模型，小度 AI 眼镜可以独立使用也可以搭配 APP，眼镜内置中文单行，可实时回复用户的提问。硬件方面，小度 AI 眼镜搭载四麦克风阵列识别声音，采用开放式防漏音扬声器设计，搭载 1600 万像素超广角镜头和 AI 防抖算法；30min 即可充满电，实现 56 小时待机，超 5 小时连续聆听；整机重量仅为 45 克，低于行业平均的 49 克。预计小度 AI 眼镜将在明年上半年上市销售，售价尚未公布，不过展台工作人员表示，价格可能在 2000 元左右。 AI 应用的繁荣时期即将到来? 李彦宏在会上谈到，在过去 24 个月里，AI 行业发生了显著的变化，其中最为突出的是大模型基本消除了幻觉现象。这一变化使得 AI 从最初的「一本正经的胡说八道」变得可用且可信赖。大模型本质上是一个概率模型，其生成的内容具有一定的不确定性。然而，通过采用 RAG 技术，大模型能够利用检索到的信息来指导文本或答案的生成，从而显著提高了内容的质量和准确性。为了解决图像生成中的幻觉问题，百度在今年年初开发了一项技术——iRAG（Image based RAG），即检索增强的文生图技术。在此之前，完全基于大语言模型的文生图系统生成的图片往往质量低劣，甚至逻辑不合常理。百度的 iRAG 技术结合了百度搜索的亿级图片资源和强大的基础模型能力，能够生成各种超真实的图片，整体效果远超文生图原生系统，消除了机器生成的痕迹。随着 AI 生成图片的可用性大幅提高，其应用空间也得到了极大的拓展。例如，在品牌宣传场景中，以前制作一组海报可能需要投入数十万元，而现在创作成本几乎为零。简而言之，iRAG 的商业价值体现在无幻觉、超真实、低成本和即时可得等方面。李彦宏在大会现场｜图片来源：百度当基础模型能力成熟时，AI 应用的繁荣时期也即将到来。那么，AI 应用从何而来，又将走向何方？主要有两大方向：一是智能体，二是产业应用。在未来，或许当 AI 应用的繁荣时期真正到来时，AI 也能真正实现它「产业革命级机会」的使命，为社会经济带来生产力的无限扩张。

AI 应用时代，真的来了吗？

今年的百度世界大会主题是「应用来了」——截至 11 月初，百度文心大模型的日均调用量已经超过 15 亿，相较一年前首次披露的 5000 万次，增长约 30 倍。李彦宏表示，「这条陡峭的增长曲线，代表着过去两年中国大模型应用的爆发。」

而智能体作为 AI 应用的最主流形态，即将迎来爆发点，李彦宏强调，「它将成为 AI 原生时代，内容、信息和服务的新载体。」

这是因为，「一方面，做智能体的门槛足够低；另一方面，智能体的天花板又足够的高，可以做出功能非常强大的应用。多个智能体的协作，还可以解决更加复杂的问题。」

李彦宏在会上展示了 4 种不同类型的智能体，包括公司类智能体，角色类智能体，工具类智能体和行业类智能体。其中，公司官方智能体很可能替代官网，成为最直接面向消费者的界面。

「公司类智能体相当于 AI 时代的公司官网。传统官网具有的那些能力，比如公司介绍、产品图片和参数展示、线下门店位置等等，公司类智能体都有。而传统网站没有的主动推荐、及时响应和一对一服务能力，公司智能体也有。」

李彦宏还发布了无代码工具「秒哒」——一个由大模型和智能体组成的、不需要写代码就能够实现任意想法的软件，包括无代码编程、多智能体协作以及规模化地调用各种工具等能力，是「迄今为止人类历史上最复杂的多智能体协作工具」。

借助「秒哒」，用户可以通过自然语言交互完成整套系统的搭建，还可以做任意场景下的各种应用，随着基础模型能力提升，以及秒哒本身技术能力的演进，未来可以做更多、更复杂的事情，「这意味着，你不需要去招募项目经理、设计人员、开发人员、测试人员等等，自己就可以指挥多个智能体来协同完成任务」，一个人可以是一整支队伍。

用李彦宏的话来说，有了秒哒，将迎来一个「只靠想法就能赚钱的时代」。

文库与网盘融合：更自由地创作

继 9 月百度网盘的 C 端业务重新划归移动生态事业群组（MEG），并由百度副总裁、百度文库&百度网盘负责人王颖接手管理后，在本次世界大会上，百度网盘和文库又有了进一步融合。

王颖在大会上分享了百度在内容生产和消费方面的一些新变革。她谈到，当前内容创作和消费面临诸多挑战，如工具繁杂、制作周期长和消费效率低。为此，百度文库和网盘引入了 AI 技术，旨在打破工具束缚和模态边界，实现更自由、高效的内容体验。

百度文库推出的智能 PPT 生成、AI 论文创作、AI 画本制作、AI 搜索能力和 AI 小说漫画生成等功能显著提升了内容生产的效率和质量；同时，在内容消费方面，百度网盘推出了简单扫描、简单听记和 AI 视频摘要等工具，极大地方便了用户处理和理解信息。

具体来看，在办公场景中，百度文库提供了智能 PPT 和智能研报功能，百度网盘则具备简单听记等功能；在学习场景下，用户可以使用百度文库的智能画本和拍图搜题功能，百度网盘则提供视频解读和盘盘单词等辅助学习工具；在娱乐方面，百度文库提供智能小说和智能漫画，百度网盘则具备 AI 修图等功能。百度文库与网盘的融合拓宽了用户的应用场景，实现了内容的智能化和多样化，进一步提升了用户体验。

自由画布功能｜图片来源：百度

此外，百度文库与网盘联合推出了全新的内容操作系统——自由画布。这一系统可以帮用户完成从找资料、到编辑、再到生成和分享的全部任务，不仅支持全格式输入和多种模态的输出，还能实现元素级别的内容利用，丰富了创作和分享的自由度。

用李彦宏的话说，「自由画布就是一个由文心多模态大模型加持的万能白板」。这些创新不仅展示了 AI 技术在内容领域的巨大潜力，也预示着内容生产和消费未来有更多可能性。

智能云：从技术变革走向产业变革

在大会上，百度集团执行副总裁、百度智能云事业群总裁沈抖分享了百度智能云在大模型和 AI 原生应用方面的最新进展。沈抖称，大模型技术正在从技术变革走向产业变革，重新定义人与数字世界及物理世界的交互方式，成为企业提升竞争力的关键要素。

沈抖重点谈到了千帆平台，这是一个大模型精调和应用开发的平台，提供丰富的工具链，显著降低了 AI 原生应用开发的门槛。千帆平台不仅满足了企业级应用的高度可定制化、大规模、高可用性和高安全性需求，还发布了工作流 Agent。这一创新利用大模型的意图理解和泛化能力，将复杂的工作流程变成灵活的智能体，大幅提升企业效率。例如，太平洋保险利用千帆平台生成「金牌销售」智能体，显著提升了车险续保的服务效率和用户体验。

百度智能云千帆｜图片来源：百度

此外，百舸平台提供高效的大模型相关算力服务，从集群创建到模型训练和推理，确保稳定、极速的性能。该平台解决了大规模集群部署中的关键难题，支持高效运行，满足不同客户的算力需求。

沈抖还展示了千帆平台在多个行业中的应用案例，包括全诊医学通过精调模型提升病历生成准确度，节省医生时间；国家电网基于文心大模型探索电力行业的 AI 应用，取得显著成果。此外，曦灵 4.0 平台的升级使其能够生成 3D 数字人形象并制作专业视频，大幅降低了短视频制作成本。

百度智能云通过千帆和百舸平台，构建了新型 AI 基础设施，推动了大模型技术在各行各业的应用，以提升企业的智能化水平和效率。

小度 AI 眼镜：首搭中文大模型

除了应用，百度这次在硬件上也有所发布。在会上，百度集团副总裁、小度科技 CEO 李莹发布了「首款搭载中文大模型的原生 AI 眼镜」——小度 AI 眼镜。

小度AI眼镜｜图片来源：百度

李莹称，AI 眼镜作为人类的第一视角设备，其捕捉视觉、声音、位置等信息的能力，将给人们带来前所未有的感官延伸，也一定会成为更高效、便捷的人机交互入口。

基于文心大模型和 DuerOS AI 原生操作系统，小度 AI 可实现备第一视角拍摄、边走边问、卡路里识别、识物百科、视听翻译、智能备忘等功能。

通过端云结合大模型，小度 AI 眼镜可以独立使用也可以搭配 APP，眼镜内置中文单行，可实时回复用户的提问。

硬件方面，小度 AI 眼镜搭载四麦克风阵列识别声音，采用开放式防漏音扬声器设计，搭载 1600 万像素超广角镜头和 AI 防抖算法；30min 即可充满电，实现 56 小时待机，超 5 小时连续聆听；整机重量仅为 45 克，低于行业平均的 49 克。

预计小度 AI 眼镜将在明年上半年上市销售，售价尚未公布，不过展台工作人员表示，价格可能在 2000 元左右。

AI 应用的繁荣时期即将到来?

李彦宏在会上谈到，在过去 24 个月里，AI 行业发生了显著的变化，其中最为突出的是大模型基本消除了幻觉现象。这一变化使得 AI 从最初的「一本正经的胡说八道」变得可用且可信赖。大模型本质上是一个概率模型，其生成的内容具有一定的不确定性。然而，通过采用 RAG 技术，大模型能够利用检索到的信息来指导文本或答案的生成，从而显著提高了内容的质量和准确性。

为了解决图像生成中的幻觉问题，百度在今年年初开发了一项技术——iRAG（Image based RAG），即检索增强的文生图技术。在此之前，完全基于大语言模型的文生图系统生成的图片往往质量低劣，甚至逻辑不合常理。百度的 iRAG 技术结合了百度搜索的亿级图片资源和强大的基础模型能力，能够生成各种超真实的图片，整体效果远超文生图原生系统，消除了机器生成的痕迹。

随着 AI 生成图片的可用性大幅提高，其应用空间也得到了极大的拓展。例如，在品牌宣传场景中，以前制作一组海报可能需要投入数十万元，而现在创作成本几乎为零。简而言之，iRAG 的商业价值体现在无幻觉、超真实、低成本和即时可得等方面。