AI日报:科大讯飞星火多模态交互大模型上线;Anthropic发布提示词优化新功能;腾讯AI智能工作台ima上线Windows版

1、科大讯飞星火多模态交互大模型上线实现“语音、视觉、数字人交互”三合一

科大讯飞最新推出的讯飞星火多模态交互大模型标志着其从单一语音交互技术拓展到音视频流实时多模态交互的新阶段。该模型集成了语音、视觉和数字人交互功能,实现了三者的无缝结合,引入了超拟人数字人技术,提升了AI的生动性和真实感。新模型通过跨模态的语义一致性实现了情感表达更加真实连贯,支持超拟人极速交互技术,提供个性化的交互体验。多模态视觉交互使模型能全面感知背景场景、物流状态,为用户提供更丰富和精准的交互体验。

【AiBase提要:】

科大讯飞推出讯飞星火多模态交互大模型,集成语音、视觉和数字人交互功能,实现无缝结合。

引入超拟人数字人技术,数字人动作与语音内容精准匹配,提升AI的生动性和真实感。

支持超拟人极速交互技术,实现语音到语音的端到端建模,提供个性化的交互体验。

2、Anthropic发布提示词优化新功能

Anthropic最新推出的提示词优化新功能为开发者带来了巨大便利,提升AI应用的可靠性和效率。优化器通过先进工程技术自动完善提示词,准确率提升30%,字数准确率达100%,用户可提供反馈进一步改进。示例管理功能使开发者能结构化管理示例,简化流程。Kapa.ai已成功迁移多个AI工作流至Claude平台,称赞优化器帮助提速生产环节。

提示词优化新功能提升AI应用可靠性和效率

优化器自动完善提示词,准确率提升30%,字数准确率达100%

示例管理功能简化示例管理流程,Kapa.ai成功迁移多个AI工作流至Claude平台

3、大升级!ChatGPTWindows桌面版全面上线,macOS版新增与应用协作功能

ChatGPTWindows桌面应用全面上线,提升用户体验。

macOS新增与应用协作功能,开发者可直接分析代码获取智能建议。

OpenAI计划扩展更多应用支持,助力AI工具在桌面工作中实用性提升。

4、腾讯AI智能工作台ima.copilot上线Windows版本

处理本地文件,自动总结内容,生成脑图,支持多语言翻译,方便用户理解和使用不同语言资料。

提供个人知识库和24小时在线私人助理服务,为用户打造专属图书馆,提供便捷高效的工作学习体验。

5、一句话帮你生成应用!阿里通义上线代码模式

通义代码模式让用户通过简单指令生成各种应用,包括小游戏、数据图表等。

用户可访问通义网页版,点击“代码模式”开始体验全新交互方式。

代码模式基于Qwen2.5-Coder开发,提升了AI编程性能和效率。

6、波士顿动力Spot机器人新技能轻松躲避电线、梯子等障碍物!

波士顿动力公司的机器人犬Spot近期进行了重要的软件更新,使其在复杂环境中的行动能力大幅提升。这次更新不仅增强了Spot的自主导航能力,也为其在更多复杂环境中的应用奠定了基础。

Spot机器人现在可以自动识别和避开电线、梯子等障碍物。

最新的视频中出现了神秘的恐龙头机器人,激发了观众的好奇心。

软件更新使Spot的导航能力更强,应用前景更加广阔。

7、谷歌GeminiExp1114横空出世!首战碾压GPT-4,多项能力评测登顶引业界震动

谷歌最新推出的Gemini实验版本(Exp1114)在ChatbotArena平台上取得了令人瞩目的成绩,超越竞品,展现出惊人实力。Gemini-Exp-1114以超出40分的优异成绩与GPT-4-latest并列第一,在数学、复杂提示和创意写作等核心领域全面登顶。业内分析认为,这次突破性进展显示出谷歌在AI领域的长期投入开始收获成果。

Gemini-Exp-1114在总体评分上超越GPT-4-latest并列第一,展现出极强的综合实力。

Gemini-Exp-1114在数学、复杂提示和创意写作等核心领域全面登顶,表现令人印象深刻。

9、AI玩《我的世界》大比拼!Claude新版本建筑水平惊艳全网

Sonnet3.6在创意性方面胜出,获得2000多名网友的投票支持。

AI建造过程不依赖视觉理解,通过文本形式提供上下文生成操作指令。

项目组计划将评测机制进一步完善,打造类似Lmsys竞技场的评分系统,采用Elo算法根据人类用户投票进行排名。

10、小马智行正式启动IPO,预计募资最高达3.78亿美元

小马智行正式启动IPO,计划在纳斯达克上市,募资最高达3.78亿美元。多家汽车制造商参与认购,推动Robotaxi技术合作与全球布局。【AiBase提要:】

小马智行开启IPO,计划在纳斯达克上市,募资最高达3.78亿美元。

主要资金将用于自动驾驶服务的商业化及技术研发。

多家汽车制造商参与认购,推动Robotaxi技术合作与全球布局。

THE END
1.AI视频生成工具什么是AI视频生成工具? 视频生成工具的作用通常是给定一个视频,对视频进行风格转换成我们想要的风格。 具有哪些风格? 2D 3D japanese_anime low_poly 有什么作用? 视频风格迁移在多个领域有着广泛的实用价值,尤其是在艺术创作、影视制作、广告设计和增强现实等方面。以下是一些具体的应用场景和实用价值: https://blog.csdn.net/m0_56515793/article/details/141862611
2.推荐!当下好用的8款AI视频生成工具推荐!当下好用的8 款 AI 视频生成工具 ? 打开App看更多精彩内容 打开App阅读全文财经热榜 AI热榜 民生热榜 股票热榜 1 国家网信办集中整治网上金融信息乱象 涉“零门槛”“零利息”等话术诱导借贷 市场资讯40条评论今天16:00打开APP 2 百姓“药篮子”怎样升级?国家医保局权威解读 新华网4条评论今天20:https://cj.sina.cn/articles/view/1773655610/p69b7d63a02701bv0s
3.Sora生成的62个AI视频及提示词合集作者:杨文;来源:AI先锋官 小编还过着年呢,OpenAI就毫无征兆地祭出大杀器——Sora,一款文本转视频模型,可生成长达60s的视频,同时保持视觉质量。 目前,Sora还未真正向大众开放,只有一些视觉艺术家、设计师、电影制作人、OpenAI员工获得了Sora访问权限。(切记:不要被人割韭菜) 还是奥特曼(ChatGPT之父、OpenAI首席执行https://www.digitaling.com/articles/1040899.html
4.视频,除了OpenAISora,这13个视频生成式ai工具你需要了解一下AI视频生成式是指利用人工智能技术和大量数据,通过模拟人类创作过程,自动生成具有特定风格和内容的视频作品的技术。 这种技术可以应用于多个领域,如广告、社交媒体、个人纪念视频等。通过使用生成式AI技术,用户可以快速生成高质量的视频内容,节省时间和人力成本,同时提高创作效率和便捷性。 https://heehel.com/aigc/ai-vid-topic.html
5.智谱清影标签:AI视频智谱AI智谱清影 访问智谱清影-AI生视频官网 智谱清影是智谱 AI 推出的视频生成工具。 7月 26 日,智谱宣布生成式视频能力全面上线,其旗下的清影功能正式与用户见面。清影依托于智谱自研的视频生成模型 CogVideoX,普通用户即日起可在智谱清言 PC 和 APP 端使用。 https://aishenqi.net/tool/zhipuqingying
6.建筑学长——千万建筑师的资源库和AI绘图创作平台建筑学长官网,为青年设计师建立的线上资源共享及AI绘图创作渲染平台,免费提供海量设计案例、CAD图纸、SU模型、PS素材、软件插件下载,提供丰富的设计软件教学与灵感参考素材图库。http://jianzhuxuezhang.com/
7.Pixeling千象:一站式AI图片和视频生成平台新媒派Pixeling千象是由智象未来(HiDream.ai)开发的一站式AI图片和视频生成平台。它基于先进的生成式人工智能(AIGC)多模态大模型,用户可以通过输入简单的中英文描述或上传参考图,一站式生成图片和视频。https://pidoutv.com/sites/17529.html
8.2023年10大研究!「神经朗琪罗」秒变逼真大卫,用AI生成3D虚拟世界主题的主要分布:3个有关具身AI(机器人,虚拟角色);2个有关3D生成模型;2个图形处理;2个图像生成;1个视频生成的研究。 TOP 1:「神经朗琪罗」让16世纪的大卫复活 来自英伟达和约翰霍普金斯大学的研究人员提出的新型AI模型,利用神经网络重建3D物体。最新研究还被CVPR 2023录用。 https://wallstreetcn.com/articles/3704895
9.AI短视频神器Gen2开放测试!靠打字做短视频的时代来了?大家好,这里是和你们一起探索 AI 的花生。 前几天知名 AI 视频处理平台 Runway 宣布开放测试旗下的 GEN-2,一款可以直接根据文本生成视频的工具,我们先看看官方放出的 2 个演示: 视频来源:推特@runwayml https://twitter.com/i/status/1664256235665866752 视频来源:Gen-2 Now Available | Runway - YouTube 了https://uisdc.com/gen-2
10.港科大(广州)人工智能专家陈颖聪:文生视频让自动驾驶看到新方向近年来,生成式人工智能在AI技术应用中成为焦点,尤其是文本生成视频大模型Sora,近来更是在全球范围内激发了科技创新的热潮。香港科技大学(广州)人工智能学领域助理教授兼博士生导师陈颖聪教授,作为计算机视觉与机器学习学域的资深研究者,对文本生成视频技术的最新发展保持着高度关注。近日,这位人工智能领域专家分享了他对Sorhttps://static.nfapp.southcn.com/content/202403/18/c8698823.html
11.实测7款「Sora级」视频生成神器,谁有本事登上「铁王座」?AI 理解的动漫风格的袋鼠可真是五花八门,有像老鼠的,也有像不明物种的。相比而言,可灵、Vidu 和 Runway Gen-3 效果更佳,起码没有大面积的模糊虚化。 -2- 图生视频 这几家号称对标 Sora 的视频生成模型也均上线了「图生视频」功能,只需上传一张图片,输入提示词就可让静态图片动起来。 https://www.myzaker.com/article/66accbc38e9f093a6b6f8e29
12.国产文生视频大模型“筑梦”亮相,助央视制作AI动画片《千秋诗颂在场景和建筑美术设计环节,输入“中国风,唐朝,官员宴客厅”等提示词后,“书生·筑梦”即可再现大唐场景。在辅助动效生成环节,选取一张官员图片,再输入“唐朝,一个官员,哈哈大笑”,就生成了官员端起酒杯大笑的短视频。 AIGC技术制作的动画片质量到底如何?近日播出后,将由观众评判。在林达华看来,这种科研机构与传媒机https://www.jfdaily.com/news/detail?id=719205
13.阿里发布AI生视频模型:通义万相走出了自己的“中国风”特色除了上面的国风效果,还能融合多种风格,比如写实风格、毛毡动画、CG 厚涂、3D 动漫、勾线动画等风格。请看以下视频: 多种元素、多种风格的融合十分有利于想象力旺盛的创作,很多时候传统影视无法实现的效果,完全可以用 AI 来生成,而通义万相弥补了概念组合、元素结合、以及更强的想象力,想要什么有什么,带来更强的创http://www.zaker.cn/news/article_new.php?pk=66ecedfbb15ec06c403ccfd9
14.3个支持图片转视频的AI工具分享给你!Kaiber 是一款 AI 工具,主要用于视频生成,支持 AI 文本生成视频、AI 图片转视频。Kaiber 提供各种视频生成风格,如动漫、概念艺术、印象主义等。还可以进行多种自定义选择,无需任何视频编辑经验,0 基础新人也可以生成高质量视频。Kaiber 涉猎的领域非常多,无论是音乐视频、社交媒体内容还是现场视觉效果等等,Kaiber https://js.design/special/article/ai-image-to-video.html
15.zfcg.fuzhou.gov.cn/upload/document/20210531/a2f60d92e4d649a9c、福建省政府采购网上公开信息系统对投标保证金实行一个项目(合同包)一个帐号的制度,系统平台自动生成供应商所投合同包的缴交银行账号,同一项目不同合同包同一投标人或不同投标人系统自动生成的帐号均不相同,不得混用。 同一项目再次采购时将采用不同的帐号,投标人需重新缴交投标保证金,否则会造成开标前核验保证金http://zfcg.fuzhou.gov.cn/upload/document/20210531/a2f60d92e4d649a9bd2b904312f583f0.html