微软Copilot Studio新增自定义AI代理功能;百度文心一言4.0 Turbo发布

OpenAI推出Sora视频生成模型API,支持1080P长视频定制


OpenAI正式开放Sora视频生成模型API,用户可通过文本指令生成最长60秒、1080P分辨率的定制化视频,支持镜头运动、风格迁移等参数调整,面向影视、广告等领域开放企业级订阅服务。

简评:Sora API落地将大幅降低专业视频创作门槛,推动AI从“辅助工具”向“核心生产力”跃迁,但需警惕深度伪造内容的滥用风险。

谷歌Gemini Ultra上线多模态推理功能,可解析复杂图文逻辑


谷歌宣布Gemini Ultra大模型新增多模态推理能力,能同时处理文本、图像、表格等混合信息,完成“分析财报图表+总结文字结论+预测趋势”等跨模态任务,已在Workspace套件中灰度测试。

简评:多模态推理是大模型“通用智能”的关键一步,Gemini Ultra的升级或重塑办公场景的信息处理方式,拉开与竞品的技术代差。



百度文心一言4.0 Turbo发布,响应速度提升3倍成本降50%


百度推出文心一言4.0 Turbo版本,通过模型压缩与算力优化,实现单次对话响应时间缩短至0.8秒(较原版快3倍),企业调用成本降低50%,同步开放代码生成、数学推理专项增强接口。


简评:Turbo版本直击企业“降本增效”痛点,国产大模型商业化进程加速,但需持续优化复杂任务的准确性以巩固竞争力。



微软Copilot Studio新增自定义AI代理功能,非技术人员可搭建专属助手


微软Copilot Studio平台上线“无代码AI代理构建器”,用户无需编程即可通过拖拽模块创建个性化AI助手,支持对接企业内部系统(如CRM、ERP),已集成至Microsoft 365商业版。


简评低代码AI代理工具普及将释放中小企业智能化潜力,推动AI应用从“标准化”走向“场景化”,但数据安全与权限管理成关键挑战。


Meta开源Llama 3-70B多语言模型,覆盖100+语种翻译与生成


Meta发布开源大语言模型Llama 3-70B,重点强化多语言能力,支持100+语种的文本生成、实时翻译及文化语境适配,模型权重与训练框架完全开放,供全球开发者免费商用。


简评:Meta以开源策略抢占多语言AI生态高地,有望打破英语主导的大模型格局,但需应对不同语种数据质量差异导致的性能波动问题。




Copyright © 2024 友益典文化 版权所有

粤ICP备2024271549号