OpenAI发布DALL·E 3更新版;百度文心一言4.0“行业知识增强版”发布

百度文心一言4.0“行业知识增强版”发布,覆盖100+垂直领域


百度针对金融、医疗、法律等100+垂直领域推出文心一言4.0行业增强版,内置超5000万条专业知识(如最新医保政策、证券法条款),行业问答准确率提升至93%,已接入企业微信、钉钉等办公平台。


简评:行业知识增强版破解大模型“通用不精”痛点,推动AI从“聊天工具”转向“专业助手”,但需定期更新知识库避免政策、法规滞后。


Stability AI推出Stable Diffusion 3.0,支持3D模型生成与动态光影渲染


Stability AI发布Stable Diffusion 3.0图像生成模型,新增3D模型生成功能(支持.obj/.glb格式导出)与动态光影渲染,可生成带物理光照效果的室内设计图,开源社区下载量破200万次。


简评:3D生成能力打通2D设计与3D建模链路,游戏、建筑行业概念设计效率或提升50%,但需解决3D模型的拓扑结构合理性问题(如面数过多导致卡顿)。


微软Azure新增AI多模态功能,支持图文混合输入


微软宣布Azure AI平台新增多模态能力,可同时处理文本、图像和视频输入,实现跨模态信息检索和内容生成。该功能主要面向开发者与企业客户,旨在提升智能客服和数据分析效率。


简评:多模态能力是未来AI交互的关键方向,Azure此举将帮助更多行业快速实现复杂场景下的智能化服务。


OpenAI发布DALL·E 3更新版,支持更高分辨率生成


新版DALL·E 3可生成最高4K分辨率的图片,并改进了细节还原和风格一致性。官方表示新版本已通过更严格的内容审核机制。


简评:高分辨率生成能力将拓展AI在广告、影视等领域的应用空间,但版权争议仍待解决。


谷歌Gemini Ultra 1.5上线“长上下文记忆”功能,支持100万token历史对话


谷歌宣布Gemini Ultra 1.5支持100万token(约75万字)的超长上下文记忆,可连续分析整本书籍、会议纪要或代码库,保持多轮对话的逻辑连贯性,已在Workspace中开放测试。


简评:长上下文能力让大模型真正具备“持续学习”属性,法律文书起草、代码维护等场景效率大幅提升,但需防范历史信息干扰导致的回答偏差。


Copyright © 2024 友益典文化 版权所有

粤ICP备2024271549号