乌镇峰会重磅发布!360首发《大模型安全白皮书》,首提“全链路AI安全防线”应对智能时代新威胁
StepFun AI 推出开源音频编辑模型 Step-Audio-EditX,实现音频编辑新体验
简评:StepFun AI 推出开源音频编辑模型 Step-Audio-EditX,使音频编辑更简便;该模型采用大边距学习,提升情感和风格编辑的准确性。
Grok支持纯文本生成视频了
Grok Imagine推出全新功能,支持纯文本生成短视频,用户只需输入描述即可在17秒内生成带背景音效、动态镜头与专业画质的视频片段。该功能不仅提升了视频创作效率,还通过多模态交互闭环实现了人机共创。
图片源自网络
简评:支持纯文本生成短视频,17秒内完成视频制作;提供多种风格切换和创意模式,满足多样化创作需求;实现人机共创,支持实时调整提示词以优化视频效果。
阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹,挑战 OpenAI 的领先地位
阿里巴巴的 Qwen3-Max-Thinking 在全球数学竞赛中表现出色,展示了其强大的推理和问题解决能力,并在加密货币交易中取得了显著的投资回报,挑战了 OpenAI 的领先地位。
百度重磅发布新一代多模态AI模型ERNIE-4.5-VL
百度发布了新一代多模态AI模型ERNIE-4.5-VL,该模型不仅具备强大的语言处理能力,还引入了“图像思考”功能,显著提升了图像理解和处理能力。
简评:ERNIE-4.5-VL 模型具备强大的语言处理能力,同时引入了“图像思考”功能;该模型采用仅有3B的激活参数,展现出优秀的计算效率和灵活性; “图像思考”功能支持图片放大和图片搜索等工具调用,丰富了用户在图像和文本之间的交互体验。