🎉 最新发布 kimi k2.5 模型,支持多模态理解与处理,擅长解决更复杂的问题,快来体验吧!
文档
入门指南
Kimi K2.5 多模态模型

Kimi K2.5

Kimi K2.5 是 Kimi 迄今最智能的模型,在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。同时 Kimi K2.5 也是 Kimi 迄今最全能的模型,原生的多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。技术Blog (opens in a new tab)

kimi-k2.5

  • Kimi K2.5 作为国内领先的 Coding 模型,Kimi K2.5 在原有全栈开发与工具生态优势基础上,进一步强化前端代码质量与设计表现力前端能力,实现了跨越式突破,支持从自然语言直接生成功能完整、视觉精美的交互界面,并能精准处理动态布局、滚动动画等复杂效果。

  • kimi-k2.5kimi-k2-0905-Previewkimi-k2-turbo-previewkimi-k2-thinkingkimi-k2-thinking-turbo 模型均提供 256K 上下文窗口

  • kimi-k2.5 仍然具备超强的思考能力,支持多步工具调用和推理,擅长解决复杂问题,如复杂的逻辑推理、数学问题、代码编写等。

  • 立即体验:在开发工作台,快速通过交互式操作测试模型在业务场景上的效果
  • 申请 API Key:立即通过 API 调用测试

以下是完整的调用示例,帮助您快速上手 Kimi K2.5 多模态模型。

Kimi API 完全兼容 OpenAI 的 API 格式,你可以通过如下方式来安装 OpenAI SDK:

pip install --upgrade 'openai>=1.0'

python -c 'import openai; print("version =",openai.__version__)'
 
# 输出可能是 version = 1.10.0,表示 OpenAI SDK 已经安装成功,当前 python 实际使用了 openai 的 v1.10.0 的库
 

import os
import base64
 
from openai import OpenAI
 
client = OpenAI(
    api_key=os.environ.get("MOONSHOT_API_KEY"),
    base_url="https://api.moonshot.cn/v1",
)
 
# 在这里,你需要将 kimi.png 文件替换为你想让 Kimi 识别的图片的地址
image_path = "kimi.png"
 
with open(image_path, "rb") as f:
    image_data = f.read()
 
# 我们使用标准库 base64.b64encode 函数将图片编码成 base64 格式的 image_url
image_url = f"data:image/{os.path.splitext(image_path)[1]};base64,{base64.b64encode(image_data).decode('utf-8')}"
 
 
completion = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "你是 Kimi。"},
        {
            "role": "user",
            # 注意这里,content 由原来的 str 类型变更为一个 list,这个 list 中包含多个部分的内容,图片(image_url)是一个部分(part),
            # 文字(text)是一个部分(part)
            "content": [
                {
                    "type": "image_url", # <-- 使用 image_url 类型来上传图片,内容为使用 base64 编码过的图片内容
                    "image_url": {
                        "url": image_url,
                    },
                },
                {
                    "type": "text",
                    "text": "请描述图片的内容。", # <-- 使用 text 类型来提供文字指令,例如“描述图片内容”
                },
            ],
        },
    ],
)
 
print(completion.choices[0].message.content)
 

import os
import base64
 
from openai import OpenAI
 
client = OpenAI(
    api_key=os.environ.get("MOONSHOT_API_KEY"),
    base_url="https://api.moonshot.cn/v1",
)
 
# 在这里,你需要将 kimi.mp4 文件替换为你想让 Kimi 识别的视频的地址
video_path = "kimi.mp4"
 
with open(video_path, "rb") as f:
    video_data = f.read()
 
# 我们使用标准库 base64.b64encode 函数将视频编码成 base64 格式的 video_url
video_url = f"data:video/{os.path.splitext(video_path)[1]};base64,{base64.b64encode(video_data).decode('utf-8')}"
 
 
completion = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "你是 Kimi。"},
        {
            "role": "user",
            # 注意这里,content 由原来的 str 类型变更为一个 list,这个 list 中包含多个部分的内容,视频(video_url)是一个部分(part),
            # 文字(text)是一个部分(part)
            "content": [
                {
                    "type": "video_url", # <-- 使用 video_url 类型来上传视频,内容为使用 base64 编码过的视频内容
                    "video_url": {
                        "url": video_url,
                    },
                },
                {
                    "type": "text",
                    "text": "请描述视频的内容。", # <-- 使用 text 类型来提供文字指令,例如"描述视频内容"
                },
            ],
        },
    ],
)
 
print(completion.choices[0].message.content)
 

图片支持 png、jpeg、webp、gif;视频支持 mp4、mpeg、mov、avi、x-flv、mpg、webm、wmv、3gpp 格式。

图片与视频进行动态token计算,可以通过 计算token接口 ,在开始理解前获取包含图片或视频的请求的token消耗。

一般说来,图片分辨率越高,消耗的token越多;视频由若干张关键帧组成,关键帧的数量越多,分辨率越高,则token消耗越多。

Vision 模型在计费方式上与 moonshot-v1 系列模型保持一致,根据模型推理的总 Tokens 计费,详情请查看:

关于token价格,详见 模型推理价格说明

我们推荐图片分辨率不超过4k (4096*2160),视频分辨率不超过2k (2048*1080),再高的分辨率只会增加处理时间,也不会对模型理解的效果有提升。

由于我们对请求体的整体大小有限制,所以对于非常大的视频,必须使用上传文件的方式使用视觉理解功能。对于需要多次引用的图片或视频,我们推荐使用文件上传的方式使用视觉理解功能。关于上传文件的限制,请参阅 文件上传 文档。

图片数量限制:Vision 模型没有图片数量限制,但请确保请求的 Body 大小不超过 100M

URL 格式的图片:不支持,目前仅支持使用 base64 编码的图片内容

chat 文档中有一系列参数,但对于k2.5系列模型,其行为会有所不同。

我们建议用户不要手动设置这些字段,而是使用默认值

参数变动列举如下

字段是否必须说明类型取值
max_tokensoptional聊天完成时生成的最大 token 数。int默认值为32k,即32768
thinkingoptional新增 该参数控制模型是否启用思考。object默认值为{"type": "enabled"}. 只能为 {"type": "enabled"}{"type": "disabled"}
temperatureoptional使用什么采样温度。floatk2.5 系列模型将使用确定值 1.0, 非思考模式下将使用确认值 0.6。若指定其他值,将会报错。
top_poptional采样方法。floatk2.5 系列模型将使用确定值 0.95。若指定其他值,将会报错。
noptional为每条输入消息生成多少个结果。intk2.5 系列模型将使用确定值 1。若指定其他值,将会报错。
presence_penaltyoptional存在惩罚。floatk2.5 系列模型将使用固定值 0.0。 若指定其他值,将会报错。
frequency_penaltyoptional频率惩罚。floatk2.5 系列模型将使用确定值 0.0。若指定其他值,将会报错。

模型
计费单位
输入价格
(缓存命中)
输入价格
(缓存未命中)
输出价格
模型上下文长度
kimi-k2.5
1M tokens¥0.70¥4.00¥21.00262,144 tokens

Last updated on