18818713530

阿里通义发布语音双模型:支持 FreeStyle 自然语言控制;Google NotebookLM 信息图自定义样式功能正式上线

一句话即刻“调教”音色!阿里通义发布语音双模型:支持 FreeStyle 自然语言控制


阿里通义实验室推出两款革命性语音生成模型,支持自然语言指令控制音色和场景,显著提升语音创作效率与质量。


简评Fun-CosyVoice3.5 支持多语种语音生成和精细化控制,提升语音表达的准确性与自然度。Fun-AudioGen-VD 能够根据描述生成“人物 + 场景”的一体化音频,增强环境沉浸感。两款模型均支持“FreeStyle”指令,用户可通过自然语言精准控制声音风格或构建复杂音频场景。


Google NotebookLM 信息图自定义样式功能正式上线


Google NotebookLM正式上线信息图自定义样式功能,提供10种预设样式选项并支持自定义编辑,用户可轻松调整视觉呈现方式。该功能通过单击操作将复杂源素材快速转换为高质量信息图,极大降低了制作门槛,适用于学习总结、知识分享和教学演示等场景。


简评:10种预设样式选项,支持完全自定义编辑。单击一下即可将复杂源素材转换为信息图。提升创作趣味性和实用性,适合学习总结、知识分享等场景。


Claude Code官方语音模式上线:输入/voice,按住空格说话,AI编程效率直接起飞

Claude Code推出了语音模式功能,使开发者能够通过自然语音快速下达指令,提升编程协作效率。该功能已逐步向用户推送,并具有实时语音转录、解放双手高效协作和原生集成稳定可靠等亮点。

简评:实时语音转录:语音内容瞬间转化为可编辑文本,便于即时修正或补充细节。解放双手高效协作:适合描述复杂逻辑、汇报Bug、重构代码或规划项目等场景,开发者可专注思考而非机械打字。原生集成稳定可靠:作为Claude Code官方原生功能,与现有CLI/终端工作流无缝衔接,兼容性优于第三方语音方案。

创意一站式打通!谷歌升级 Flow AI 工具:视频、绘画与特效全融合

谷歌对Flow AI工具进行了大规模功能扩展,集成了图像生成技术Whisk和ImageFX,为创作者提供了一个统一的AI创意工作室。

简评:统一工作流:用户可在同一界面完成从图片生成到动画制作的全过程。 ImageFX驱动:利用谷歌最新DALL-E级别的图像模型生成高质量素材。动态化编辑:强化了动画制作功能,支持更精细的动作流向和特效表现。

QM发布2025年AI应用榜:豆包、DeepSeek、元宝、阿福、千问排前五

Quest Mobile发布的《2025年AI应用层发展核心报告》显示,截至2025年12月,全市场AI原生App中,月活跃用户排名前五的是豆包、DeepSeek、元宝、蚂蚁阿福和阿里千问,蚂蚁集团的灵光也进入前十。报告分析称,2025年国内AI应用呈现从“通用覆盖”到“场景穿透”的趋势,前十AI App中有6个通用AI,4个垂类场景的专业AI。字节系和阿里系AI应用占据了前十中的六个席位。


简评:AI原生App月活跃用户排名前五为豆包、DeepSeek、元宝、蚂蚁阿福和阿里千问。2025年国内AI应用呈现从“通用覆盖”到“场景穿透”的趋势,前十AI App中有6个通用AI,4个垂类场景的专业AI。字节系和阿里系AI应用占据前十中的六个席位,分别有3个应用上榜。




Copyright © 2024 友益典文化 版权所有

粤ICP备2024271549号