百度文心一言4.0“行业知识增强版”发布,覆盖100+垂直领域
百度针对金融、医疗、法律等100+垂直领域推出文心一言4.0行业增强版,内置超5000万条专业知识(如最新医保政策、证券法条款),行业问答准确率提升至93%,已接入企业微信、钉钉等办公平台。
Stability AI推出Stable Diffusion 3.0,支持3D模型生成与动态光影渲染
Stability AI发布Stable Diffusion 3.0图像生成模型,新增3D模型生成功能(支持.obj/.glb格式导出)与动态光影渲染,可生成带物理光照效果的室内设计图,开源社区下载量破200万次。
简评:3D生成能力打通2D设计与3D建模链路,游戏、建筑行业概念设计效率或提升50%,但需解决3D模型的拓扑结构合理性问题(如面数过多导致卡顿)。
微软Azure新增AI多模态功能,支持图文混合输入
微软宣布Azure AI平台新增多模态能力,可同时处理文本、图像和视频输入,实现跨模态信息检索和内容生成。该功能主要面向开发者与企业客户,旨在提升智能客服和数据分析效率。
简评:多模态能力是未来AI交互的关键方向,Azure此举将帮助更多行业快速实现复杂场景下的智能化服务。
OpenAI发布DALL·E 3更新版,支持更高分辨率生成
新版DALL·E 3可生成最高4K分辨率的图片,并改进了细节还原和风格一致性。官方表示新版本已通过更严格的内容审核机制。
简评:高分辨率生成能力将拓展AI在广告、影视等领域的应用空间,但版权争议仍待解决。
谷歌Gemini Ultra 1.5上线“长上下文记忆”功能,支持100万token历史对话
谷歌宣布Gemini Ultra 1.5支持100万token(约75万字)的超长上下文记忆,可连续分析整本书籍、会议纪要或代码库,保持多轮对话的逻辑连贯性,已在Workspace中开放测试。
简评:长上下文能力让大模型真正具备“持续学习”属性,法律文书起草、代码维护等场景效率大幅提升,但需防范历史信息干扰导致的回答偏差。