史上最卷12月:全球15家Top级AI公司疯狂上新,你记住了谁?调用auto视频生成模型

2024年的最后一个月,全球AI圈好像约好了,一起开启年底狂卷模式,批量发布新品。

「四木相对论」统计,这场年末上新的“战局”,至少有15家全球Top级AI公司,上新了20+个功能。

差不多同期,Google、xAI、WorldLabs、Meta、Amazon、Pika、Runway等海外名企,也都上新了AI功能。

国内的12月,大厂、六小虎和AI鲶鱼DeepSeek,无一不踏入战局。

“卷王”字节首当其冲。它在豆包和即梦中上新了图像理解能力。

六小虎中的MiniMax、阶跃星辰、智谱AI,有的在卷模型,有的卷Agent应用。Deepseek和腾讯,直接上新并开源了模型。

整体来看,各大公司近期的更新呈现以下特点:

但卷归卷,不少产品也因缺乏曝光等原因,发布得“悄无声音”。

还有些万众期待的产品,比如Sora,收获了满屏差评。

在这个轰轰烈烈的12月,目前你记住了谁?

海外:OpenAI挤牙膏,其他家无人care?

这个12月,已经加入AI上新战局的海外公司,至少有OpenAI、Google、xAI、Meta、Amazon、Pika......

"营销专家"OpenAI的声势最大。

12月6日,它拉开了“双十二”的阵仗,要连做十二场发布会。

目前日程已经进入到七天,发布成果如下:

不仅是OpenAI,Google、Pika、Midjourney、xAI也在这周有了新动作。

12月14日,Pika上新模型2.0,引入了场景元素(SceneIngredients)功能。

这一功能允许用户自由选择角色、物品、服装和场景元素,根据需求构建特点镜头。同时,Pika2.0支持多人在同一画布上协作。

12月12日凌晨,谷歌发布了Gemini2.0,声称“Gemini2.0是我们迄今为止最新、功能最强大的AI模型。”

这一模型,可以支持图片、视频和音频等多模态的输入和输出,速度也是1.5Pro的两倍,还能直接调用GoogleSearch、代码执行等工具。

在Gemini2.0架构之上,谷歌还推出或升级了三个新的AIAgent原型:通用大模型助手ProjectAstra、浏览器助手ProjectMariner、编程助手Jules。

不过Gemini2.0的声量相较于Sora小得多。

这可能也是因为Gemini2.0的更新,虽然好评很多,但至少从表述上看起来很“常规”:更快速的响应、支持联网搜索、新上线的“深度研究”功能支持多轮复杂推理、代码生成增强、第三方工具调用能力补充。

同一天,Midjourney官宣了patchwork功能更新。

这是一个允许多人在线共同创建出一个世界的实验性功能,所有参与者将在一块白板画布上共同创作,(有点像Canva和Figma的共同编辑)。

而且画布还给了每个用户的世界创建了一个传送门,可以连接到别人的世界去。

之前Midjourney的更新,基本都围绕着图片生成的能力,比如支持AI修图、支持新画风的模型等等。

但这次的Patchwork让MJ在玩法上产生大不同,从一个只能一个人用的图片生成工具,变成了一个可以让大家一起玩起来的AI艺术创作产品。

手握巨卡的xAI,同样在卷视觉方向。

12月10日,xAI发布了首款完全自研图像生成模型Aurora。

Aurora已经直接集成到了Grok,这是一个自回归混合专家模型(MoE),在混合文本和图像数据集上完成了训练。除了图片生成,Grok还有编辑能力,用户可以直接在生成的图像上进行修改,这一功能也将上线X。

Meta也在12月7日发布了Llama3.3,在性能上开卷。

据说,现在70B的版本就能实现以前405B的性能。

它在指令遵循(IFEval)、数学(MATH)、推理(GPQADiamond)等领域,水平都超过了七月份发布的Llama3.1405B。在语言(MMLU)、代码(HumanEval)、长文本和多语种能力上,成绩也和Llama3.1405B比较接近。

官方将Llama3.3的进步归功于新的对齐过程和在线强化学习技术的进步。

Runway则在前一天,12月6日更新了自己的act-one功能。

这个新功能允许用户将自己拍摄的表演表演动作或声音直接“套用”到已有的视频角色上(包括AI角色)。

在12月最早打响发布“竞赛”的,其实是“AI教母”李飞飞。

12月3日,李飞飞创立的WorldLabs首次官宣了「空间智能」模型,利用一张图,就能生成一个3D世界。

这些3D场景都能在浏览器中实时渲染,还能实现可控的相机效果,可调节的模拟景深。

也是在同一天,亚马逊对外发布了多模态模型Nova系列。

亚马逊这次直接发了一个大号全家桶,包括:

超快速文本生成模型AmazonNovaMicro,能够处理文本、图像和视频并生成文本的多模态模型AmazonNovaLite、AmazonNovaPro和AmazonNovaPremier,用于生成高质量图像的AmazonNovaCanvas和用于生成高质量视频的AmazonNovaReel。

好吧,OpenAI的营销又赢了。

国内:六小虎大厂混战视觉

相比海外,国内厂商们的“卷”势更早出现。

各家的方向从模型卷到产品,离不开视觉和生产力两个话题。

「四木相对论」也对近半个月的新品进行了汇总:

大公司里,字节和腾讯是12月最卷的大厂(通义千问在11月28日发布了QWQ模型)。

在这个月里,前者在豆包和即梦上先后更新功能,后者一下子开源了视频生成模型。

先看字节。

12月10日,豆包官方表示,电脑版的视频生成功能已经开启内测。

获得内测资格的账号显示,每日可免费生成十支视频。内测申请通过后,选择“视频生成”功能,上传一张图片,输入提示词,并添加运镜、分镜信息,就能生成短视频。

再往前的12月5日,豆包增加了AI生成文字图功能。

也就是说,用户现在可以提示词中加入文本要求,生成带有指定文字的图片,做海报、做表情包都能用。

类似的功能还体现在即梦上。

12月2日晚,即梦上新2.1模型。这次的模型突破体现在中文文字稳定生成,当然也支持英文。

腾讯混元这个月最大的动作,就是正式上线视频生成能力。

12月3日,腾讯不仅上线了这个130亿参数的模型,还开源了。

目前,模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”版块申请试用。企业客户通过腾讯云提供服务接入,API同步开放内测申请。

「四木相对论」观察到,腾讯混元系列模型在这两个月动作比较频繁。

11月初,它宣布最新的MoE模型“混元Large”以及混元3D生成大模型“Hunyuan3D-1.0”正式开源。12月又上新文生视频能力,正式加入了卷视频模型的队列。

大厂之外,大模型六小虎中的三虎——智谱AI、MiniMax和阶跃星辰也在本月上新。

先来看智谱。

12月的智谱,在模型和应用两端发力。首先是多模态模型——GLM-4V-Flash上线了智谱的开放平台,可以免费调用。

GLM-4V-Flash模型拥有图像描述生成、图像分类、视觉推理、视觉问答(VQA)以及图像情感分析等图像处理功能。

多模态/视觉类的API都非常的贵,号称视觉能力对标GPT-4omini模型的GLM-4V-FlashAPI免费,也称得上是真卷。

产品方面,Auto-GLM是智谱近期的重点。

首先智谱在11月29日发布了Auto-GLM的手机版和电脑版。半个月之后的12月12日,Auto-GLM又更新了一个版本。

用户打开AutoGLM后,可以语音发指令,让智能体接管自己的手机,并在可操作的App上自动执行购买外卖,订高铁票、目的地导航等任务。

经过「四木相对论」测试,更新之后Auto-GLM支持的应用更稳定。同时它还增加了自定义高频短口令,快速触发常用任务等功能。

智谱CEO张鹏在发布会现场的AI发红包操作一度刷屏。「四木相对论」也复刻了“AI发的第一个红包”。

Minimax,同样在这个月卷起了多模态。

12月3日,海螺AI图生视频模型I2V-01-Live上线了。

视频生成一定是MiniMax今年的亮点之一。之前,MiniMax的亮点几乎全部集中于Talkie,但海螺视频的上线,打破了这一印象。

这次I2V-01-Live,更新了二维插画的动态呈现方式,让动画稳定性和细腻表现力有了增强。一张图+一句话就能将2D插画转化为动态视频。

一直略显低调的另一只小虎,阶跃星辰也有模型层的更新。

周五(12月13日)阶跃星辰发布了端到端语音大模型——Step-1o。

从官方介绍来看,Step-1o支持语音、文本等混合形式的输入和输出,能理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。它还能够通过自学和模仿不断提升回复质量,提供解决问题的专业建议。

场景上,它支持包括新闻播报、聊天陪伴、有声读物、在线教育、智能硬件、汽车等对语音交互技术的需求。

近期,Step-1o将接入跃问App端,实现实时语音通话服务。

国内AI圈另一无法忽视的角色——DeepSeek,在短短半月内进行了两次上新。

最新开源的DeepSeek-VL2(12月13日发布)是一个专家混合(MoE)语言模型。

DeepSeek-VL2比一代DeepSeek-VL多一倍优质训练数据,引入梗图理解、视觉定位、视觉故事生成等新能力。视觉部分使用切图策略支持动态分辨率图像,语言部分采用MoE架构低成本高性能。

这次大模型价格“卷王”,更是在视觉模型上开“卷”。

根据DeepSeek提供的评测对比,DeepSeek-VL2在相似或更少的激活参数下实现了竞争性或最先进的性能。

另外,DeepSeekV2.5系列的最终版微调模型——DeepSeek-V2.5-1210也在2月10日更新。

据官网介绍,这次更新通过Post-Training全面提升了模型各方面能力表现,包括数学、代码、写作、角色扮演等。同时,新版模型优化了文件上传功能,并且全新支持了联网搜索,可以服务各类工作生活场景。

不同于某些AI公司只强调功能或者模型的偏好,这次DeepSeekV2.5-1210模型更新后,它的Chat窗口呈现出两个Tag——“深度思考”和“联网搜索”。

这似乎在告诉外界:产品日常场景和模型推理能力,我全都要。真的是卷王了。

毕竟,OpenAI的年末发布刚刚走过一半。字节也会在下周举行大会,强调豆包、即梦的更新。

THE END
1.人工智能ai软件哪个好市场上最受欢迎的5款AI工具在当今这个科技日新月异的时代,人工智能(AI)已经渗透到我们生活的方方面面,从企业管理到个人娱乐,再到教育和医疗,它都扮演着越来越重要的角色。随着技术的不断进步,市场上出现了众多的人工智能软件,每种产品都有其独特之处和强项,因此选择合适的人工智能软件成为了许多用户的心头大难题。 https://www.206sk8xl.cn/ke-ji/540393.html
2.人工智能软件哪个好比较大众认可的几款AI工具人工智能软件哪个好比较大众认可的几款AI工具 深度学习平台TensorFlow TensorFlow是一款由Google开发的开源深度学习框架。它以其强大的计算能力和灵活性而受到广泛欢迎。TensorFlow不仅支持Python,还支持C++、Java等多种编程语言,能够在服务器端运行,也能在移动设备上进行优化。此外,社区非常活跃,有丰富的文档和教程,可以快https://www.pv40pux4.com/xing-ye-zi-xun/434842.html
3.AIApp排行榜:2023年最受欢迎的人工智能应用–Multiable万达宝人工智能(AI)技术在过去几年间迅猛发展,已经深入到各个行业和领域,从生活到工作,各种AI应用日益普及,改变了我们日常生活的方方面面。从智能助手、自动驾驶到内容创作、医疗辅助,AI技术的应用场景不断扩展,给用户带来更加便捷和智能化的体验。2023年,AI应用不仅在传统领域取得了进一步突破,同时也开始渗透到更多新兴行业和https://www.multiable.com.cn/?p=91464
4.全球人工智能App排名榜单新鲜出炉,着实令人振奋!咱们国内有好几全球人工智能 App 排名榜单新鲜出炉,着实令人振奋!咱们国内有好几款应用上榜,其中豆包更是出类拔萃。之前有同事对豆包有所质疑,可如今这实打实的榜单排名就是最好的回应。豆包的强大功能与出色表现大家有目共睹,无论是知识问答的精准全面,还是交流互动的流畅自然,亦或是对各种复杂需求的良好应对,都彰显着它的卓越。https://weibo.com/7522637545/P50PDu68W
5.MyAskAI的应用程序信息(由MyAskAI提供)公司网站 https://myaskai.com 应用的使用条款 https://myaskai.com/terms 应用的核心功能 使用My AskAI,你可以上传团队的内容/数据,然后开始提问,例如 ChatGPT,但需要自己的知识库。 公司总部位置 大不列颠和北爱尔兰联合王国 () 应用信息页 https://myaskai.com/connect-askai-with-teams 用于运行应https://learn.microsoft.com/zh-cn/microsoft-365-app-certification/teams/my-askai?pivots=general
6.国泰君安10、表2:AI软件全球MAU总榜如下,ChatGPT稳居榜首,国内豆包位居第二全球排名产品名应用(APP)简短描述APPMAUMAU变化1ChatGPTTheof计算机行业ficialappbyOpenAI25816M1454%2豆包AI智能助手|抖音513M910%3Nova聊天AI与AI写作机器人4697M769%4Remini人工智能修图2857M252%5AskAIChatwithAskAI2838M2。 11、88%6ChatOnPohttp://huiyunyan.com/doc-2254662d2c23d260248ea989b3aeeb15.html
7.AskAIAskAI 具有拟人化的问答AI,解决您头脑里的问题风暴,支持前后连续问答。 自媒体维基致力于优质、实用的网络站点资源收集与分享!https://www.zmt.wiki/sites/17376.html
8.Chat&AskAIbyCodewayontheAppStoreAI's friendly, conversational tone and personalized recommendations make it easy to chat about anything, from the mundane to the profound. --- Privacy Policy: https://static.askaichat.app/privacy-en.html Terms of Use: https://static.askaichat.app/terms-conditions-en.html more https://apps.apple.com/sg/app/chat-ask-ai-by-codeway/id1668787639?l=zh-Hans-CN
9.顶级AI工具:你错过了哪些?https://app.humata.ai/ Visus:帮助研究者高效理解和提取文档中的关键信息的文档分析工具。 https://app.visus.ai/ My AskAI:一个平台,允许用户使用特定内容创建自己的ChatGPT,适合回答关于小众主题的详细问题。 https://myaskai.com/ SciSpace (Typeset):强大的创建、发布和发现研究论文的工具,SciSpace集成了https://www.360doc.cn/article/77847039_1133359277.html
10.AiAsk合肥阿巴阿巴科技有限公司旗下面向人工智能从业者的问答社区http://www.aiask.cn/
11.AI智能问答与免费文案生成,写作助手助您高效创作!AI人工智能在线问答 ai人工智能问答机器人,对话式ai-智能对话UNIT,人工智能对话聊天机器人。AI人工智能在线问答机器人,提供免费文案生成服务。对话式AI-智能对话UNIT,让您的交流更高效。体验人工智能对话聊天机器人的强大功能,享受便捷智能的在线问答服务。 http://ask.buhuw.com/
12.文件数据恢复大师免费数据恢复软件!文件数据恢复大师,专业解决手机、苹果、电脑、U盘等所有数据恢复问题。点击立即恢复,保障您的重要信息[免费数据恢复软件,手机数据恢复,苹果数据恢复,微信聊天记录恢复,电脑数据恢复,U盘数据恢复,SD卡数据恢复,移动硬盘数据恢复,误删数据恢复,格式化数据http://dr-guide.myaskai.cn/
13.GitHubxiaozhouzhoua/Myphodal/understand-prompt - 【 内含不适合未成年人阅读的图片】基于我擅长的编程、绘画、写作展开的 AI 探索和总结:StableDiffusion 是一种强大的图像生成模型,能够通过对一张图片进行演化来生成新的图片。ChatGPT 是一个基于 Transformer 的语言生成模型,它能够自动为输入的主题生成合适的文章。而 Githubhttps://github.com/xiaozhouzhoua/My-Stars
14.AskAIAI神器大全类似AskAI的软件 斑头雁 BattleYeah AI 简单、易用的AI 应用开发平台 Atlancer AI 通过文本创建自己的AI工具 Axiom 浏览器扩展程序 Aspen Web 应用程序无代码平台 Amarkdown AI markdown编辑利器 10Web AI WordPress平台 暂无评论https://aishenqi.net/tool/askai
15.AskAI写作专家app下载AskAI写作专家最新软件下载v1.0.6AskAI写作专家是一个可以自动帮助你完成写作的软件。它内置了先进的人工智能。写的文章内容很好,语法非常正确,使用了很多修辞写作手法,让用户慢慢掌握一些写作技巧。该应用程序将在很短的时间内为您生成所需的文章内容。如果你感兴趣,请下载该软件并试用。 http://www.1666.com/sjrj/v543009.html
16.问问AI陕ICP备2024026341号-3AskAsk AI 首页 热门搜索 搜索记录 登录注册 AskAsk AI 有不懂,就问问AI 热门问题:http://www.askaskai.com/
17.NAVIGATINGAIDISRUPTIONAsk AI is an independent nonprofit that's been helping professionals stay one step ahead of artificial intelligence opportunities and disruptions since 2017. Our volunteers produce a newsletter, podcast, short videos, free events, open research, and fundhttps://www.askai.org/
18.AskAiAskAi - 人工智能解决方案 我们是一家专注于人工智能解决方案的公司,帮助企业提高其业务效率和准确性。 服务 人工智能咨询服务 机器学习解决方案 自然语言处理服务 智能数据分析 联系我们 如果您有任何问题或需要我们的服务,请随时联系我们。 Name Email Messagehttps://www.askai.run/
19.AskAI–AIPoweredChatBotAssistantAsk AI – AI Powered Chat Bot Assistant怎么用 使用智能问答非常简单,只需开始与它聊天,提出问题或请求写作帮助。聊天机器人将利用先进的人工智能算法为您提供准确且有用的回复。 Ask AI – AI Powered Chat Bot Assistant的核心功能 智能问答的核心功能包括即时回答、人工智能写作帮助,以及与流行通讯平台(如Whatshttps://openi.cn/sites/274199.html
20.AskAI写作专家APP安卓版下载软件介绍 软件截图 相关文章 合集推荐 AskAI写作专家集成了先进的AI智能,它可以帮助用户们轻松地完成写作任务,使用AskAI写作专家,用户们可以获得高质量的文章内容,这些内容不仅在语法方面非常准确,而且还使用了许多修辞和写作技巧,此外,AskAI写作专家还可以在极短的时间内为用户生成所需的文章,让用户可以更加高效地https://www.yxwoo.com/ghjt/111507.html
21.AI对话AI赋能引领者https://ai.aiasking.cn/
22.用ASKAI以博士研究生水平生成800字以内评论胡锡进的评论用AskAI自动生成评论,让它以博士研究生水平做一个“评论胡锡进”的不超过800字的评论,它生成了这样: “胡锡进是一位备受争议的媒体人物,他的言论常常引发社会热议。有人认为他言辞犀利,直言不讳,是一位有勇气说真话的评论家;而也有人认为他言辞过激,缺乏客观性,是一位喜欢挑衅的言论家。在我看来,胡锡进的评论确https://user.guancha.cn/wap/content?id=1210118
23.设计理念与用户体验成功的aiask网站运营要素分析在人工智能问答系统问世之初,人们对其功能和效率充满了好奇。随着时间的推移,这些系统逐渐从单一功能向多元化发展,尤其是aiask网站,其在知识获取、学习辅助以及日常问题解决方面发挥了巨大作用。然而,对于这些网站来说,设计理念和用户体验至关重要,因为它们直接影响到用户的参与度和忠诚度。 https://www.xzqwdbbb.cn/shi-chang/514196.html
24.十大痛苦癌症排行癌症人们常说的癌症,实际上就是起源于上皮组织的恶性肿瘤,其中有很多癌症的发病率非常之高,比如近日发生的父子三人接连查出癌症就是发病率高达50%的胃肠癌,而在十大恶性肿瘤痛苦排名中,有很多就与我们的生活息息相关。 十大恶性肿瘤痛苦排名:肺癌、胃癌、肝癌、食管癌、结直肠癌、胰腺癌、乳腺癌、脑癌、血癌、淋巴癌。https://tag.120ask.com/jibing/aizheng/1136171.html
25.全网刷屏的ChatGPT,这次免翻直接用!Ask AI(网页) 这个网站同样是基于 ChatGPT 制作的,支持免登录直接使用。 不过该网站针对 IP 有次数限制,每个人都有 30 次免费回复机会,大家打开后可以体验一下。 不知道是不是错觉,懂哥感觉这个网页的风格有点熟悉。 回到的速度也还行,不快不慢: https://www.leikeji.com/article/54780
26.foraresponseorIwillcanceltherequestandaskforaI am waiting a reply or then I go to cancel the order and to ask for the reimbursement! 相关内容 ai started to grope your ass 我开始摸索您的驴子 [translate] a请适量点菜 Please right amount order food [translate] a招标文件需在30日前提交监理工程师 The tender document must submit before http://ruidianyu.zaixian-fanyi.com/fan_yi_5879064