谷歌Mixboard重磅升级;智谱重磅开源 AutoGLM:能点外卖、订机票

谷歌Mixboard重磅升级:Nano Banana Pro加持,无限画布秒变演示文稿


谷歌Labs推出的Mixboard工具通过集成自研Nano Banana Pro图像模型,实现了从灵感到专业演示的高效转化,为创意生产提供了全新的解决方案。

简评:集成自研Nano Banana Pro图像模型,支持自定义提示词、框选导入、涂鸦编辑;升级核心为Nano Banana Pro驱动,实现PPT一键生成和快速迭代;开放与社区:公测限美国用户,Discord社群活跃,未来将开放API。


智谱开源 GLM-4.6V 系列:106B 原生支持 Function Call,轻量版 9B 免费商用


智谱开源 GLM-4.6V 系列模型,具备强大的多模态处理能力和原生 Function Call 功能,同时提供免费的轻量版和价格优惠的基础版,适合多种应用场景。


202406051435016830_1.jpg


图片源自网络


简评:128k 多模态上下文支持,提升长视频理解能力;原生 Function Call 能力,直接触发 API,降低延迟和提升成功率;轻量版免费商用,基础版价格腰斩,降低使用门槛。



智谱重磅开源 AutoGLM:能点外卖、订机票的手机级 AI Agent 向所有人开放


智谱开源 AutoGLM,这一具备“Phone Use”能力的 AI Agent 可以完成复杂的手机操作任务,如外卖点单和机票预订。其开源特性降低了 AI 手机的技术门槛,推动了 AI 生态从封闭走向开放,并为厂商和开发者提供了可复现、可修改、可扩展的能力底座。


简评:AutoGLM 能够稳定完成外卖点单、机票预订等复杂手机操作流程。开源后,任何厂商和开发者都可以复现 AI 助手,实现“看懂屏幕”并完成点击、输入等操作。支持本地与云端部署,保障用户数据与隐私安全。



最强编码模型上架!GPT-5.1-CodexMax 现已接入响应 API


OpenAI 宣布其最新、最强大的代理编码模型 GPT-5.1-CodexMax 已全面接入响应 API,允许开发者将这一顶级编码智能直接整合到现有应用和生产工作流中。该模型在复杂任务分解、代码生成质量、多步骤推理与自主代理执行能力方面有显著提升。通过 API 的正式开放,开发者无需等待即可在更广泛的环境中调用这一旗舰级模型。使用 API 密钥调用 CodexCLI 的用户也已同步获得 GPT-5.1-CodexMax 的访问权限。OpenAI 表示,此次更新旨在进一步降低高性能 AI 编程能力的接入门槛,让更多产品和服务能够拥有“随时可写、自动纠错、自主执行”的编程助手体验。


简评GPT-5.1-CodexMax 是 OpenAI 最新推出的强大编码模型,能够提升复杂任务分解和代码生成质量。该模型已全面接入响应 API,开发者可直接整合到现有应用和工作流中。此次更新旨在降低高性能 AI 编程能力的接入门槛,让更多产品和服务拥有编程助手体验。



谷歌推出 Doppl 购物发现功能,让虚拟试穿更轻松


谷歌在实验性应用 Doppl 中推出全新的购物发现功能,利用人工智能技术生成视频,展示真实产品,并根据用户的个人风格进行服装推荐。该功能旨在通过个性化推荐,帮助用户发现并虚拟试穿各种时尚单品。Doppl 的购物发现功能主要由人工智能生成的内容组成,而不是由现实生活中的网红进行推广。这一新功能已经在美国的 iOS 和 Android 平台上线,面向18岁及以上的用户开放。


简评:新增购物发现功能,帮助用户个性化推荐和虚拟试穿时尚单品。使用 AI 技术生成产品视频,提供更直观的购物体验。Doppl 功能已在美国上线,适用于18岁及以上用户。




Copyright © 2024 友益典文化 版权所有

粤ICP备2024271549号