一句话即刻“调教”音色!阿里通义发布语音双模型:支持 FreeStyle 自然语言控制
阿里通义实验室推出两款革命性语音生成模型,支持自然语言指令控制音色和场景,显著提升语音创作效率与质量。
Google NotebookLM 信息图自定义样式功能正式上线
Google NotebookLM正式上线信息图自定义样式功能,提供10种预设样式选项并支持自定义编辑,用户可轻松调整视觉呈现方式。该功能通过单击操作将复杂源素材快速转换为高质量信息图,极大降低了制作门槛,适用于学习总结、知识分享和教学演示等场景。
简评:10种预设样式选项,支持完全自定义编辑。单击一下即可将复杂源素材转换为信息图。提升创作趣味性和实用性,适合学习总结、知识分享等场景。
Claude Code官方语音模式上线:输入/voice,按住空格说话,AI编程效率直接起飞
Claude Code推出了语音模式功能,使开发者能够通过自然语音快速下达指令,提升编程协作效率。该功能已逐步向用户推送,并具有实时语音转录、解放双手高效协作和原生集成稳定可靠等亮点。
简评:实时语音转录:语音内容瞬间转化为可编辑文本,便于即时修正或补充细节。解放双手高效协作:适合描述复杂逻辑、汇报Bug、重构代码或规划项目等场景,开发者可专注思考而非机械打字。原生集成稳定可靠:作为Claude Code官方原生功能,与现有CLI/终端工作流无缝衔接,兼容性优于第三方语音方案。
创意一站式打通!谷歌升级 Flow AI 工具:视频、绘画与特效全融合
谷歌对Flow AI工具进行了大规模功能扩展,集成了图像生成技术Whisk和ImageFX,为创作者提供了一个统一的AI创意工作室。
简评:统一工作流:用户可在同一界面完成从图片生成到动画制作的全过程。 ImageFX驱动:利用谷歌最新DALL-E级别的图像模型生成高质量素材。动态化编辑:强化了动画制作功能,支持更精细的动作流向和特效表现。
QM发布2025年AI应用榜:豆包、DeepSeek、元宝、阿福、千问排前五
简评:AI原生App月活跃用户排名前五为豆包、DeepSeek、元宝、蚂蚁阿福和阿里千问。2025年国内AI应用呈现从“通用覆盖”到“场景穿透”的趋势,前十AI App中有6个通用AI,4个垂类场景的专业AI。字节系和阿里系AI应用占据前十中的六个席位,分别有3个应用上榜。