微软发布 VibeVoice 0.5B;亚马逊云科技发布三款新AI智能体

米哈游联创蔡浩宇推出不正经AI:会说话带喵的AnuNeko上线


米哈游联创蔡浩宇推出的AI聊天大模型AnuNeko,其独特的定位和人格设定引发了关注,并展示了其在游戏开发领域的潜在野心。


6390035023137003071376286.png


图片源自网络


简评:AnuNeko以黑猫形象呈现,强调个性化和情绪化交互体验;提供两种人格模式,分别展现温和与犀利的对话风格;希望利用AI技术打造游戏开发的AI引擎平台。


阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源,6B 参数秒杀 Flux


阿里通义实验室推出的 Z-Image-Turbo-Fun-Controlnet-Union 模型,通过集成 ControlNet 结构,实现了对图像生成的精准控制,同时具备高效的推理性能和广泛的兼容性,为开发者和创作者提供了强大的工具支持。


简评:集成 ControlNet 结构,支持多模态控制条件如边缘检测和深度映射;优化推理效率,仅需6GB VRAM即可运行,适合低端设备部署;开源生态赋能,兼容多种工具并提升图像生成的精确度与创意性。


KlingAI Avatar 2.0 上线即爆火:5 分钟唱跳一键生成,数字人正式告别“面瘫”时代


KlingAI Avatar 2.0通过多模态导演模块实现从音频到情感表演的智能跃迁,显著提升数字人的表情和动作表现力,为短视频、电商广告与教育内容等领域带来革命性影响。


简评:Avatar2.0通过多模态导演模块将音频、图像和文本提示转化为连贯故事线。在表情控制和动作设计上实现质的飞跃,避免早期AI人物的“面瘫”感。支持48fps超高帧率与1080p高清输出,用户可通过平台免费试用基础功能。


亚马逊云科技发布三款新AI智能体,Kiro可持续自主编程数日


亚马逊云科技(AWS)近日推出三款新型AI智能体,旨在提高软件开发和运维效率。其中最引人注目的是名为“Kiro”的自主智能体,它能够连续工作数天,学习用户的偏好并独立完成复杂任务。此外,AWS还推出了两款智能体:AWS安全智能体和DevOps智能体,分别负责自动识别安全隐患和进行性能测试与兼容性检查。这些智能体的推出标志着AWS在AI技术应用上的进一步深化。


简评Kiro 智能体可连续自主工作数日,能够学习用户偏好并独立完成复杂任务;AWS 安全智能体自动识别编码过程中的安全隐患并提供修复建议;DevOps 智能体专注于新代码的性能测试和兼容性检查。


微软发布 VibeVoice 0.5B:仅0.5B参数却实现300毫秒实时开口


微软发布全新实时文本转语音模型 VibeVoice-Realtime-0.5B,其小巧的体积和强大的性能为 AI 语音交互带来了新的可能性。该模型不仅支持中英文实时转录与语音生成,还能在多角色对话中保持各自独特的语气、节奏和音色特征,同时具备情感表达和上下文记忆能力,使语音更加自然真实。


简评:模型规模小但性能强,仅0.5B参数即可实现接近实时的语音生成。支持中英文实时转录与语音生成,且能自然呈现多角色对话场景。具备情感表达和上下文记忆能力,使语音更贴近真人表达。


Copyright © 2024 友益典文化 版权所有

粤ICP备2024271549号