OpenAI发布DALL·E 3更新版；百度文心一言4.0“行业知识增强版”发布_行业资讯

最新资讯

OpenAI发布DALL·E 3更新版；百度文心一言4.0“行业知识增强版”发布

百度文心一言4.0“行业知识增强版”发布，覆盖100+垂直领域

百度针对金融、医疗、法律等100+垂直领域推出文心一言4.0行业增强版，内置超5000万条专业知识（如最新医保政策、证券法条款），行业问答准确率提升至93%，已接入企业微信、钉钉等办公平台。

简评：行业知识增强版破解大模型“通用不精”痛点，推动AI从“聊天工具”转向“专业助手”，但需定期更新知识库避免政策、法规滞后。

Stability AI推出Stable Diffusion 3.0，支持3D模型生成与动态光影渲染

Stability AI发布Stable Diffusion 3.0图像生成模型，新增3D模型生成功能（支持.obj/.glb格式导出）与动态光影渲染，可生成带物理光照效果的室内设计图，开源社区下载量破200万次。

简评：3D生成能力打通2D设计与3D建模链路，游戏、建筑行业概念设计效率或提升50%，但需解决3D模型的拓扑结构合理性问题（如面数过多导致卡顿）。

微软Azure新增AI多模态功能，支持图文混合输入

微软宣布Azure AI平台新增多模态能力，可同时处理文本、图像和视频输入，实现跨模态信息检索和内容生成。该功能主要面向开发者与企业客户，旨在提升智能客服和数据分析效率。

简评：多模态能力是未来AI交互的关键方向，Azure此举将帮助更多行业快速实现复杂场景下的智能化服务。

OpenAI发布DALL·E 3更新版，支持更高分辨率生成

新版DALL·E 3可生成最高4K分辨率的图片，并改进了细节还原和风格一致性。官方表示新版本已通过更严格的内容审核机制。

简评：高分辨率生成能力将拓展AI在广告、影视等领域的应用空间，但版权争议仍待解决。

谷歌Gemini Ultra 1.5上线“长上下文记忆”功能，支持100万token历史对话

谷歌宣布Gemini Ultra 1.5支持100万token（约75万字）的超长上下文记忆，可连续分析整本书籍、会议纪要或代码库，保持多轮对话的逻辑连贯性，已在Workspace中开放测试。

简评：长上下文能力让大模型真正具备“持续学习”属性，法律文书起草、代码维护等场景效率大幅提升，但需防范历史信息干扰导致的回答偏差。