18818713530

最新资讯

乌镇峰会重磅发布！360首发《大模型安全白皮书》,百度重磅发布新一代多模态AI模型

乌镇峰会重磅发布！360首发《大模型安全白皮书》，首提“全链路AI安全防线”应对智能时代新威胁

文章指出，随着大模型在金融、政务等关键领域的广泛应用，其带来的安全风险日益凸显。360数字安全集团发布的《大模型安全白皮书》系统性揭示了大模型全生命周期中的五大核心风险，并提出‘外挂式安全 + 平台原生安全’双轨治理框架，为高危AI时代提供纵深防御屏障。

简评：白皮书揭示大模型全生命周期的五大核心风险，涵盖基础设施层、内容层、数据与知识库层、智能体层和用户端层；提出‘外挂式安全 + 平台原生安全’双轨治理框架，实现从外部监测到内部嵌入的安全防护；强调构建开放、协同、可信的AI安全生态，推动标准制定、威胁情报共享与开源工具共建。

StepFun AI 推出开源音频编辑模型 Step-Audio-EditX，实现音频编辑新体验

StepFun AI 发布了开源音频编辑模型 Step-Audio-EditX，通过将音频编辑任务转化为文本式的令牌操作，使得语音编辑更加直接和可控。该模型利用双代码本标记器和大边距学习方法，在情感和风格编辑方面表现出色，并引入了新的基准测试以提升音频质量评估。

简评：StepFun AI 推出开源音频编辑模型 Step-Audio-EditX，使音频编辑更简便；该模型采用大边距学习，提升情感和风格编辑的准确性。

Grok支持纯文本生成视频了

Grok Imagine推出全新功能，支持纯文本生成短视频，用户只需输入描述即可在17秒内生成带背景音效、动态镜头与专业画质的视频片段。该功能不仅提升了视频创作效率，还通过多模态交互闭环实现了人机共创。

图片源自网络

简评：支持纯文本生成短视频，17秒内完成视频制作；提供多种风格切换和创意模式，满足多样化创作需求；实现人机共创，支持实时调整提示词以优化视频效果。

阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹，挑战 OpenAI 的领先地位

阿里巴巴的 Qwen3-Max-Thinking 在全球数学竞赛中表现出色，展示了其强大的推理和问题解决能力，并在加密货币交易中取得了显著的投资回报，挑战了 OpenAI 的领先地位。

简评：目前OpenAI在通用模型上仍有优势，但Qwen3的进步确实展现了国产模型在垂直领域的竞争力，不宜过度神化单项成绩，技术发展需要理性关注。

百度重磅发布新一代多模态AI模型ERNIE-4.5-VL

百度发布了新一代多模态AI模型ERNIE-4.5-VL，该模型不仅具备强大的语言处理能力，还引入了“图像思考”功能，显著提升了图像理解和处理能力。

简评：ERNIE-4.5-VL 模型具备强大的语言处理能力，同时引入了“图像思考”功能；该模型采用仅有3B的激活参数，展现出优秀的计算效率和灵活性； “图像思考”功能支持图片放大和图片搜索等工具调用，丰富了用户在图像和文本之间的交互体验。