米哈游联创蔡浩宇推出不正经AI:会说话带喵的AnuNeko上线

阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源,6B 参数秒杀 Flux
简评:集成 ControlNet 结构,支持多模态控制条件如边缘检测和深度映射;优化推理效率,仅需6GB VRAM即可运行,适合低端设备部署;开源生态赋能,兼容多种工具并提升图像生成的精确度与创意性。
KlingAI Avatar 2.0 上线即爆火:5 分钟唱跳一键生成,数字人正式告别“面瘫”时代
KlingAI Avatar 2.0通过多模态导演模块实现从音频到情感表演的智能跃迁,显著提升数字人的表情和动作表现力,为短视频、电商广告与教育内容等领域带来革命性影响。
简评:Avatar2.0通过多模态导演模块将音频、图像和文本提示转化为连贯故事线。在表情控制和动作设计上实现质的飞跃,避免早期AI人物的“面瘫”感。支持48fps超高帧率与1080p高清输出,用户可通过平台免费试用基础功能。
亚马逊云科技发布三款新AI智能体,Kiro可持续自主编程数日
亚马逊云科技(AWS)近日推出三款新型AI智能体,旨在提高软件开发和运维效率。其中最引人注目的是名为“Kiro”的自主智能体,它能够连续工作数天,学习用户的偏好并独立完成复杂任务。此外,AWS还推出了两款智能体:AWS安全智能体和DevOps智能体,分别负责自动识别安全隐患和进行性能测试与兼容性检查。这些智能体的推出标志着AWS在AI技术应用上的进一步深化。
微软发布 VibeVoice 0.5B:仅0.5B参数却实现300毫秒实时开口
简评:模型规模小但性能强,仅0.5B参数即可实现接近实时的语音生成。支持中英文实时转录与语音生成,且能自然呈现多角色对话场景。具备情感表达和上下文记忆能力,使语音更贴近真人表达。