百度发布全新多模态 AI 助手 “超能小度”,视频生成可控性再升级!

百度发布全新多模态 AI 助手 “超能小度”,数千万设备可免费升级!


百度在11月13日的百度世界大会上推出了升级版多模态AI助手“超能小度”,标志着公司在人机交互技术上的重要进步。该助手不仅具备语音和视觉识别功能,还能通过空间环境信息提升用户体验。数千万已售的小度设备将获得免费升级,让用户享受更智能的生活方式。

image.png

图片源自网络


简评:超能小度结合语音、视觉及空间环境信息,提升设备感知能力;用户可通过语音指令完成拍照、记录停车位等操作,增强实用性;在家庭场景中,超能小度可提醒家长关注孩子成长,并帮助找回遗失物品。


谷歌Gemini Live语音大升级!语速随心调、口音任你选,ChatGPT语音模式遭遇最强挑战


谷歌Gemini Live语音功能的升级,通过五大核心能力将AI对话推向新高度,为用户带来更自然、个性化的交互体验。

简评:语速随口令实时变化,支持个性化语言训练;情绪感知,语气自适应,提升对话体验;口音个性注入,让对话更有趣。



视频生成可控性再升级!可灵2.5Turbo模型上线“首尾帧”功能


可灵2.5Turbo模型的推出,显著提升了AI视频生成的可控性、稳定性与一致性,为专业创意内容生产提供了更优质的解决方案。其在动态效果、文本响应精度、风格保持能力以及整体美学效果方面均有明显提升,并引入了全新的首尾帧功能,使创作者能够更精准地控制视频的起点和终点状态。


简评:可灵2.5Turbo模型显著提升了AI视频生成的可控性和稳定性;在动态效果、文本响应精度和风格保持能力上实现突破;新增首尾帧功能,帮助创作者精准控制视频的起点和终点状态。



百度发布全新原生全模态大模型文心5.0


百度在2025年11月13日的百度世界大会上正式推出了最新原生全模态大模型——文心5.0。该模型拥有2.4万亿参数量,并采用了原生全模态统一建模技术,能够同时理解和生成文本、图像、音频和视频等多种信息,展现出强大的多模态能力。文心5.0在多个领域表现出色,其语言与多模态理解能力与国际顶尖模型相当,而图像和视频生成能力在全球领先。用户可以通过文心App体验功能,开发者和企业用户也可以通过百度千帆平台调用API服务。


简评文心5.0采用原生全模态技术,支持文本、图像、音频和视频等多种信息的理解与生成;在权威基准测试中,文心5.0的多模态理解能力与全球顶尖模型相当,显示出其强大潜力;用户可通过文心 App 体验新模型,开发者可调用 API 服务,推动智能应用的发展。


LinkedIn 推出 AI 人脉搜索:为 13 亿用户提供更智能的连接方式


LinkedIn 推出了 AI 驱动的人脉搜索功能,用户可通过自然语言查询找到相关专家。新系统能够理解搜索意图,识别相关领域的专业人士,推荐更精准的结果。团队开发了高效的技术框架,缩减模型参数以提升处理速度,优化用户体验。基础设施也进行了重要转型,将检索系统从基于 CPU 的架构转移到 GPU 架构,以应对庞大的数据量和更快的响应需求。


简评:新功能通过自然语言查询,精准推荐相关专家;技术框架“食谱”优化模型参数,提升处理速度;基础设施转型至GPU架构,提高响应效率。





Copyright © 2024 友益典文化 版权所有

粤ICP备2024271549号

<script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?923860bf7a906f677d8c0761d98235e0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); <script charset="UTF-8" id="LA_COLLECT" src="//sdk.51.la/js-sdk-pro.min.js"> <script>LA.init({id:"3JSbfvzXxrqxdY23",ck:"3JSbfvzXxrqxdY23",autoTrack:true,hashMode:true,screenRecord:true})