可生成图像或编辑图像,适用于生成证件照、电商主图、模特图、各种风格人像图(动漫、国风、二次元等),也可用于抠图、生成背景、更改图片元素等。
语音合成与识别
视频生成与编辑
向量
将文本转换成一组可以代表文字的数字,适用于搜索、聚类、推荐、分类任务。
将文本、图像、语音转换成一组数字,适用于音视频分类、图像分类、图文检索等。
行业
适用于法律咨询、案例分析和法规解读等。
以下是通义千问模型的商业版。相较于开源版,商业版具有最新的能力和改进。
模型名称
版本
上下文长度
最大输入
最大输出
输入成本
输出成本
免费额度
稳定版
30,720
8,192
100万Token
有效期:百炼开通后180天内
qwen-max-latest
最新版
qwen-max-2024-09-19
快照版
qwen-max-2024-04-28
8,000
6,000
2,000
0.04元
0.12元
qwen-max-2024-04-03
qwen-max-2024-01-07
0.038元
0.114元
129,024
qwen-plus-latest
qwen-plus-2024-11-27
qwen-plus-2024-11-25
qwen-plus-2024-09-19
qwen-plus-2024-08-06
128,000
0.004元
0.012元
qwen-plus-2024-07-23
32,000
30,000
qwen-plus-2024-06-24
qwen-plus-2024-02-06
0.00152元
0.0038元
qwen-turbo-latest
qwen-turbo-2024-11-01
1000万Token
qwen-turbo-2024-09-19
qwen-turbo-2024-06-24
0.006元
qwen-turbo-2024-02-06
输入输出单价
qwen-vl-max
qwen-vl-max-latest
qwen-vl-max-2024-11-19
qwen-vl-max-2024-10-30
qwen-vl-max-2024-08-09
qwen-vl-max-2024-02-01
qwen-vl-plus
0.008元
qwen-vl-plus-latest
qwen-vl-plus-2024-08-09
qwen-vl-plus-2023-12-01
qwen-vl-ocr
34096
30000
4096
0.005元
qwen-vl-ocr-latest
qwen-vl-ocr-2024-10-28
qwen-audio-turbo
1,500
目前仅供免费体验。
10万Token
qwen-audio-turbo-latest
6,144
2,048
qwen-audio-turbo-2024-12-04
qwen-audio-turbo-2024-08-07
qwen-math-plus
4,096
3,072
qwen-math-plus-latest
qwen-math-plus-2024-09-19
qwen-math-plus-2024-08-16
qwen-math-turbo
qwen-math-turbo-latest
qwen-math-turbo-2024-09-19
qwen-coder-plus
8192
0.0035元
0.007元
qwen-coder-plus-latest
qwen-coder-plus-2024-11-06
qwen-coder-turbo
qwen-coder-turbo-latest
qwen-coder-turbo-2024-09-19
qwq-32b-preview
16,384
Qwen2.5是Qwen大型语言模型的最新系列。针对Qwen2.5,我们发布了一系列基础语言模型和指令调优语言模型,参数规模从5亿到720亿不等。Qwen2.5在Qwen2基础上进行了以下改进:
qwen2.5-72b-instruct
qwen2.5-32b-instruct
qwen2.5-14b-instruct
qwen2.5-7b-instruct
0.001元
qwen2.5-3b-instruct
限时免费
qwen2.5-1.5b-instruct
qwen2.5-0.5b-instruct
qwen2-72b-instruct
qwen2-57b-a14b-instruct
65,536
63,488
qwen2-7b-instruct
qwen2-1.5b-instruct
qwen2-0.5b-instruct
qwen1.5-110b-chat
0.014元
qwen1.5-72b-chat
0.01元
qwen1.5-32b-chat
qwen1.5-14b-chat
qwen1.5-7b-chat
qwen1.5-1.8b-chat
qwen1.5-0.5b-chat
qwen-72b-chat
qwen-14b-chat
qwen-7b-chat
7,500
qwen-1.8b-chat
qwen-1.8b-longcontext-chat
限时免费(需申请)
qwen2-vl-7b-instruct
qwen2-vl-2b-instruct
qwen-vl-v1
qwen-vl-chat-v1
qwen2-audio-instruct
qwen-audio-chat
qwen2.5-math-72b-instruct
qwen2.5-math-7b-instruct
qwen2.5-math-1.5b-instruct
qwen2-math-72b-instruct
qwen2-math-7b-instruct
qwen2-math-1.5b-instruct
qwen2.5-coder-32b-instruct
qwen2.5-coder-14b-instruct
qwen2.5-coder-7b-instruct
qwen2.5-coder-3b-instruct
qwen2.5-coder-1.5b-instruct
qwen2.5-coder-0.5b-instruct
输入输出成本
llama3.3-70b-instruct
100万Token(需申请)
有效期:百炼开通后180天内。
llama3.2-3b-instruct
llama3.2-1b-instruct
llama3.1-405b-instruct
llama3.1-70b-instruct
llama3.1-8b-instruct
llama3-70b-instruct
llama3-8b-instruct
llama2-13b-chat-v2
4,000
llama2-7b-chat-v2
llama3.2-90b-vision-instruct
llama3.2-11b-vision
baichuan2-turbo
有效期:申请通过后180天内
baichuan2-13b-chat-v1
baichuan2-7b-chat-v1
baichuan-7b-v1
chatglm3-6b
7500
chatglm-6b-v2
6500
yi-large
yi-medium
yi-large-rag
16,000
yi-large-turbo
abab6.5g-chat
适合英文场景
abab6.5t-chat
适合中文场景
abab6.5s-chat
适合超长文本场景
245,000
ziya-llama-13b-v1
belle-llama-13b-2m-v1
chatyuan-large-v2
billa-7b-sft-v1
示例输入
示例输出
单价
wanx-v1
提示词:一只小狗在笑
0.16元/张
500张
wanx-sketch-to-image-lite
提示词:一棵参天大树
0.06元/张
wanx-x-painting
布局涂抹图:
提示词:一只狗戴着红色眼镜
wanx-style-repaint-v1
风格:清雅国风
0.12元/张
wanx-background-generation-v2
提示词:在桌面上,旁边有插着花朵的花瓶,背后是纯色高级的背景墙。
0.08元/张
image-out-painting
image-instance-segmentation
输出结果1:像素级掩码图像
输出结果2:可视化图像
针对人物图像的擦除、补全,推荐通过人物实例分割得到图像中不同人物对象的图像掩码,选择完整的人物图像掩码擦除一个或多个人物。
image-erase-completion
原图
待擦除区域
保留区域
wanx-style-cosplay-v1
300张
可以对上传的真人实拍商品展示图进行智能生成,将其中的模特和背景替换为心仪的内容,在保持人物姿态不变的情况下,使用虚拟模特对商品进行更加精美、多样的展示。支持各种与模特产生互动的商品,如手持小商品、服装、鞋靴、配饰等。
V2示例输入
V2示例输出
wanx-virtualmodel
V1
virtualmodel-v2
V2
shoemodel-v1
公测中
无
wanx-poster-generation-v1
"title":"元宵节",
"sub_title":"正月十五",
"body_text":"团圆时节,汤圆香甜,祝你幸福美满!",
"prompt_text_zh":"灯笼,小猫,梅花",
"wh_ratios":"竖版",
"lora_name":"童话油画",
wanx-ast
"title":"LoremIpsum",
"subtitle":"Duisauteiruredolorinreprehenderit",
"text":"VIEWNOW",
"underlay":1,
facechain-facedetect
人物图像检测
风格:商务写真
facechain-finetune
人物形象训练
2.5元/次
50次
facechain-generation
人物写真生成
0.18元/张
wordart-texture
文字纹理生成
提示词:精美玉石
风格类型:立体材质
有效期:百炼开通后365天内
wordart-semantic
文字变形
文字:桂林山水
提示词:山峦叠嶂、漓江蜿蜒、岩石奇秀
0.24元/张
wordart-surnames
百家姓生成
百家姓:沈
风格:奇幻楼阁
暂无
aitryon
AI试衣
aitryon-refiner
AI试衣-图片精修
100张
AI试衣价格表
计量单价
折扣
阶梯层级
0.60元/张
生成数量≤100张
0.55元/张
9.2折
100张<生成数量≤500张
0.50元/张
8.4折
500张<生成数量≤1000张
0.45元/张
7.5折
1000张<生成数量≤5000张
0.40元/张
6.7折
5000张<生成数量≤1万张
0.35元/张
5.8折
1万张<生成数量≤10万张
0.30元/张
5折
生成数量>10万张
生成数量≤25张
0.275元/张
25张<生成数量≤125张
0.25元/张
125张<生成数量≤250张
0.225元/张
250张<生成数量≤1250张
0.2元/张
1250张<生成数量≤2500张
0.175元/张
2500张<生成数量≤2.5万张
0.15元/张
生成数量>2.5万张
stable-diffusion-3.5-large
具有8亿参数的多模态扩散变压器(MMDiT)文本到图像生成模型,具备卓越的图像质量和提示词匹配度,支持生成100万像素的高分辨率图像,且能够在普通消费级硬件上高效运行。相比于v1.5和xl,在图像质量、文本内容生成、复杂提示理解和资源效率方面均有显著提升。
stable-diffusion-3.5-large-turbo
在stable-diffusion-3.5-large的基础上采用对抗性扩散蒸馏(ADD)技术的模型,具备更快的速度。
stable-diffusion-xl
相比v1.5做了重大改进,被认为是当前开源文生图模型的SOTA水准,具体改进包括:unetbackbone是之前的3倍;增加了refinement模块用于改善生成图片的质量;更高效的训练技巧等。
stable-diffusion-v1.5
通过clip模型将文本的embedding和图片embedding映射到相同空间,从而通过输入文本并结合unet的稳定扩散预测噪声的能力,生成图片。是一款基础的文生图模型,得到了业界广泛使用。
BlackForestLabs的开源文生图模型,尤其擅长生成包含文字、多主体、手部细节的图片。
flux-merged
结合了flux-dev的深度和flux-schnell的快速执行。
1000张
flux-dev
开发者版,面向非商业应用,具有与专业版相近的图像质量和指令遵循能力,同时运行效率更高。
flux-schnell
快速版,轻量级模型。
计费方案即将推出。
cosyvoice-v1
2元/万字符
每主账号每模型每月2000字符。
音色列表:
voice参数
音色
音频试听
适用场景
语言
默认采样率(Hz)
默认音频格式
longxiaochun
龙小淳
语音助手、
导航播报、
聊天数字人
中文+英文
22050
mp3
longxiaoxia
龙小夏
语音助手、聊天数字人
中文
longxiaocheng
龙小诚
语音助手、导航播报、聊天数字人
longxiaobai
龙小白
聊天数字人、有声书、语音助手
longlaotie
龙老铁
新闻播报、有声书、语音助手、直播带货、导航播报
中文东北口音
longshu
龙书
有声书、语音助手、导航播报、新闻播报、智能客服
longshuo
龙硕
语音助手、导航播报、新闻播报、客服催收
longjing
龙婧
longmiao
龙妙
客服催收、导航播报、有声书、语音助手
longyue
龙悦
语音助手、诗词朗诵、有声书朗读、导航播报、新闻播报、客服催收
longyuan
龙媛
有声书、语音助手、聊天数字人
longfei
龙飞
会议播报、新闻播报、有声书
longjielidou
龙杰力豆
新闻播报、有声书、聊天助手
longtong
龙彤
有声书、导航播报、聊天数字人
longxiang
龙祥
新闻播报、有声书、导航播报
loongstella
Stella
语音助手、直播带货、导航播报、客服催收、有声书
loongbella
Bella
语音助手、客服催收、新闻播报、导航播报
见下表
1元/万字符
每主账号每模型每月3万字符。
模型(音色)列表:
特色
sambert-zhinan-v1
知楠
是
通用场景
48k
sambert-zhiqi-v1
知琪
温柔女声
sambert-zhichu-v1
知厨
新闻播报
舌尖男声
sambert-zhide-v1
知德
新闻男声
sambert-zhijia-v1
知佳
标准女声
sambert-zhiru-v1
知茹
新闻女声
sambert-zhiqian-v1
知倩
配音解说、新闻播报
资讯女声
sambert-zhixiang-v1
知祥
配音解说
磁性男声
sambert-zhiwei-v1
知薇
阅读产品简介
萝莉女声
sambert-zhihao-v1
知浩
咨询男声
16k
sambert-zhijing-v1
知婧
严厉女声
sambert-zhiming-v1
知茗
诙谐男声
sambert-zhimo-v1
知墨
情感男声
sambert-zhina-v1
知娜
浙普女声
sambert-zhishu-v1
知树
资讯男声
sambert-zhistella-v1
知莎
知性女声
sambert-zhiting-v1
知婷
电台女声
sambert-zhixiao-v1
知笑
sambert-zhiya-v1
知雅
sambert-zhiye-v1
知晔
青年男声
sambert-zhiying-v1
知颖
软萌童声
sambert-zhiyuan-v1
知媛
知心姐姐
sambert-zhiyue-v1
知悦
客服
sambert-zhigui-v1
知柜
直播女声
sambert-zhishuo-v1
知硕
数字人
自然男声
sambert-zhimiao-emo-v1
知妙(多情感)
阅读产品简介、数字人、直播
多种情感女声
sambert-zhimao-v1
知猫
阅读产品简介、配音解说、数字人、直播
sambert-zhilun-v1
知伦
悬疑解说
sambert-zhifei-v1
知飞
激昂解说
sambert-zhida-v1
知达
标准男声
sambert-camila-v1
Camila
否
西班牙语女声
西班牙语
sambert-perla-v1
Perla
意大利语女声
意大利语
sambert-indah-v1
Indah
印尼语女声
印尼语
sambert-clara-v1
Clara
法语女声
法语
sambert-hanna-v1
Hanna
德语女声
德语
sambert-beth-v1
Beth
咨询女声
美式英文
sambert-betty-v1
Betty
客服女声
sambert-cally-v1
Cally
自然女声
sambert-cindy-v1
Cindy
对话女声
sambert-eva-v1
Eva
陪伴女声
sambert-donna-v1
Donna
教育女声
sambert-brian-v1
Brian
客服男声
sambert-waan-v1
Waan
泰语女声
泰语
录音文件识别
支持的语言
支持的采样率
适用的格式
paraformer-v2
中文普通话、中文方言(粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话、江西话、云南话、上海话)、英语、日语、韩语
任意
0.00008元/秒
36,000秒(10小时)
每月1日0点自动发放
有效期1个月
paraformer-8k-v2
中文普通话
8kHz
paraformer-v1
中文普通话、英语
音频或视频
paraformer-8k-v1
paraformer-mtl-v1
中文普通话、中文方言(粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话)、英语、日语、韩语、西班牙语、印尼语、法语、德语、意大利语、马来语
16kHz及以上
实时语音识别
适合场景
paraformer-realtime-v2
支持多个语种自由切换
视频直播、会议等
0.00024元/秒
paraformer-realtime-v1
16kHz
paraformer-realtime-8k-v2
paraformer-realtime-8k-v1
sensevoice-v1
超过50种语言(中、英、日、韩、粤等)
0.0007元/秒
emo-detect-v1
检测输入的图片是否符合要求,不需要部署,可直接调用
0.004元/张
200张
emo-v1
生成人物肖像动态视频,不需要部署,可直接调用
1800秒
emo-detect
检测输入的图片是否符合要求,仅支持部署后调用
当前仅支持部署后调用,仅收取部署费用。
部署单价:20元/算力单元/小时
emo
生成人物肖像动态视频,仅支持部署后调用
liveportrait-detect
检测输入的图片是否符合要求
liveportrait
生成人物肖像动态视频
0.02元/秒
计费
animate-anyone-detect
检测输入的图像是否符合要求
animate-anyone
生成人物全身动作视频
motionshop-video-detect
检测输入的视频是否符合要求
0.04元/次
50次(需申请)
motionshop-gen3d
基于人物图片生成符合要求的3D角色形象
1元/次
5次(需申请)
motionshop-synthesis
将视频中的人物替换为指定的3D角色形象,并合成新视频
0.2元/秒
600秒(需申请)
video-style-transform
视觉风格重绘
向量维度
最大行数
单行最大处理Token数
支持语种
text-embedding-v3
1024
768
512
6
中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等50+语种
0.0007元
50万Token
text-embedding-v2
1536
25
2048
中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语
text-embedding-v1
中文、英语、西班牙语、法语、葡萄牙语、印尼语
text-embedding-async-v2
100000
2000万Token
text-embedding-async-v1
v1、v2、v3模型的效果数据
MTEB
MTEB(Retrievaltask)
CMTEB
CMTEB(Retrievaltask)
58.30
45.47
59.84
56.59
60.13
49.49
62.17
62.78
63.39
55.41
68.92
73.23
v3模型三种维度的效果数据
模型维度
62.43
54.74
67.90
72.29
62.11
54.30
66.81
71.88
v3模型相比v2的更新内容
v2模型相比v1的更新内容
数据类型
multimodal-embedding-one-peace-v1
float(32)
10,000加权条目数
最大输入Token数
单价(每千Token)
opennlu-v1
0.00465元
最大Token数
单次请求最大doc数
单行最大输入字符长度
支持语言
gte-rerank
4000
500
中、英、日、韩、泰语、西、法、葡、德、印尼语、阿拉伯语等50+语种
开通百炼后自动发放
公开数据评测结果
MTEB中文&英文检索数据集排序结果。BM25召回,NDCG@10指标评测