推理提速 18%!GPT-5.2 携 32K 上下文,正面迎战 Gemini 3
OpenAI 为应对谷歌 Gemini3 的竞争压力,提前于 12 月 9 日推出 GPT-5.2,该模型推理速度提升 18%,多模态处理效率提高 23%,上下文窗口扩展至 32768tokens,...
OpenAI 放大招!GPT-5.1-Codex-Max 接入主流工具,1.25 美元 / 百万 tokens 撬动编程革命
2025 年 12 月 5 日,OpenAI 推出新款编程模型GPT-5.1-Codex-Max,价格与 GPT-5 持平,性价比突出。该模型凭借 “压缩” 技术,支持超百万 tokens 上下文,可稳...
字节 Seedream 4.5 杀疯了!多图生成终于不 “精神分裂”,角色光影 100% 统一
2025 年 12 月 4 日,字节跳动 Seed 团队发布 Seedream 4.5 图像生成模型,此次升级聚焦 “多图场景一致性” 与 “美学指令遵循” 两大核心。该模型通过全新跨图...
开源模型新王者!新加坡 Qwen-Sea-Lion-v4 弃 Llama,阿里技术成关键
2025 年 11 月 26 日,新加坡国家 AI 计划 AISG 发布新一代大语言模型 Qwen-Sea-Lion-v4,将底层模型从 Meta Llama 全面换为阿里 “通义千问” Qwen3-32B,该模...
谷歌放大招!Magika 1.0 用 Rust 重构,秒扫千文件 + 支持 200 + 格式,AI 文件检测彻底升级
谷歌开源博客宣布 AI 驱动的文件类型检测系统 Magika 1.0 发布。该版本较初代有重大升级:支持文件类型从约 100 种扩至 200 余种,新增数据科学、现代编程、D...
谷歌杀疯了!Gemini 新功能让 PPT 制作提速 10 倍,上传文档直接出成品
谷歌 Gemini AI 的 Canvas 功能更新,支持一键生成 PPT,由 Gemini2.5Pro 驱动,现向 Gemini Advanced 订阅用户开放,免费用户后续可得。用户可输提示词或传...
惊!LTX-2 横空出世:20 秒 4K 叙事视频一键生成,音画同步还能本地跑
Lightricks 发布 AI 视频生成模型 LTX-2,可一键生成 20 秒 4K 高清完整叙事视频,支持音画同步,还能通过文字、图片等多方式输入精细控制视频,支持本地在消...
国产 AI 大突破!中科大 + 字节 MoGA 模型横空出世,分钟级多镜头长视频一键生成
2025 年 10 月 24 日,中国科学技术大学与字节跳动宣布将联合发布端到端长视频生成模型 MoGA。该模型可一键生成分钟级、480p 分辨率、24 帧 / 秒的高质量视频...
一张照片变身电影大片,Gaga AI颠覆影视创作
全球首个专注于人物对话的影视级音画同步模型——Gaga AI正式亮相。这款由Gaga AI团队推出的创新工具,不再是简单的图像动画或唇形匹配,而是真正赋予AI“演员”...
OpenAI发布视频生成模型Sora2
OpenAI released Sora2 short video app, which needs to be downloaded from the overseas region store. If you can't find it by searching, you can dire...