Kimi K2.5

Kimi K2.5 是 Kimi 迄今最智能的模型，在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。同时 Kimi K2.5 也是 Kimi 迄今最全能的模型，原生的多模态架构设计，同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。技术Blog (opens in a new tab)

kimi-k2.5

Kimi K2.5 作为国内领先的 Coding 模型，Kimi K2.5 在原有全栈开发与工具生态优势基础上，进一步强化前端代码质量与设计表现力前端能力，实现了跨越式突破，支持从自然语言直接生成功能完整、视觉精美的交互界面，并能精准处理动态布局、滚动动画等复杂效果。

kimi-k2.5、kimi-k2-0905-Preview、kimi-k2-turbo-preview、kimi-k2-thinking、kimi-k2-thinking-turbo 模型均提供 256K 上下文窗口

kimi-k2.5 仍然具备超强的思考能力，支持多步工具调用和推理，擅长解决复杂问题，如复杂的逻辑推理、数学问题、代码编写等。

立即体验：在开发工作台，快速通过交互式操作测试模型在业务场景上的效果
申请 API Key：立即通过 API 调用测试

以下是完整的调用示例，帮助您快速上手 Kimi K2.5 多模态模型。

Kimi API 完全兼容 OpenAI 的 API 格式，你可以通过如下方式来安装 OpenAI SDK：

pip install --upgrade 'openai>=1.0'

python -c 'import openai; print("version =",openai.__version__)'
 
# 输出可能是 version = 1.10.0，表示 OpenAI SDK 已经安装成功，当前 python 实际使用了 openai 的 v1.10.0 的库

import os
import base64
 
from openai import OpenAI
 
client = OpenAI(
    api_key=os.environ.get("MOONSHOT_API_KEY"),
    base_url="https://api.moonshot.cn/v1",
)
 
# 在这里，你需要将 kimi.png 文件替换为你想让 Kimi 识别的图片的地址
image_path = "kimi.png"
 
with open(image_path, "rb") as f:
    image_data = f.read()
 
# 我们使用标准库 base64.b64encode 函数将图片编码成 base64 格式的 image_url
image_url = f"data:image/{os.path.splitext(image_path)[1]};base64,{base64.b64encode(image_data).decode('utf-8')}"
 
 
completion = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "你是 Kimi。"},
        {
            "role": "user",
            # 注意这里，content 由原来的 str 类型变更为一个 list，这个 list 中包含多个部分的内容，图片（image_url）是一个部分（part），
            # 文字（text）是一个部分（part）
            "content": [
                {
                    "type": "image_url", # <-- 使用 image_url 类型来上传图片，内容为使用 base64 编码过的图片内容
                    "image_url": {
                        "url": image_url,
                    },
                },
                {
                    "type": "text",
                    "text": "请描述图片的内容。", # <-- 使用 text 类型来提供文字指令，例如“描述图片内容”
                },
            ],
        },
    ],
)
 
print(completion.choices[0].message.content)

import os
import base64
 
from openai import OpenAI
 
client = OpenAI(
    api_key=os.environ.get("MOONSHOT_API_KEY"),
    base_url="https://api.moonshot.cn/v1",
)
 
# 在这里，你需要将 kimi.mp4 文件替换为你想让 Kimi 识别的视频的地址
video_path = "kimi.mp4"
 
with open(video_path, "rb") as f:
    video_data = f.read()
 
# 我们使用标准库 base64.b64encode 函数将视频编码成 base64 格式的 video_url
video_url = f"data:video/{os.path.splitext(video_path)[1]};base64,{base64.b64encode(video_data).decode('utf-8')}"
 
 
completion = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[
        {"role": "system", "content": "你是 Kimi。"},
        {
            "role": "user",
            # 注意这里，content 由原来的 str 类型变更为一个 list，这个 list 中包含多个部分的内容，视频（video_url）是一个部分（part），
            # 文字（text）是一个部分（part）
            "content": [
                {
                    "type": "video_url", # <-- 使用 video_url 类型来上传视频，内容为使用 base64 编码过的视频内容
                    "video_url": {
                        "url": video_url,
                    },
                },
                {
                    "type": "text",
                    "text": "请描述视频的内容。", # <-- 使用 text 类型来提供文字指令，例如"描述视频内容"
                },
            ],
        },
    ],
)
 
print(completion.choices[0].message.content)

图片支持 png、jpeg、webp、gif；视频支持 mp4、mpeg、mov、avi、x-flv、mpg、webm、wmv、3gpp 格式。

图片与视频进行动态token计算，可以通过计算token接口，在开始理解前获取包含图片或视频的请求的token消耗。

一般说来，图片分辨率越高，消耗的token越多；视频由若干张关键帧组成，关键帧的数量越多，分辨率越高，则token消耗越多。

Vision 模型在计费方式上与 moonshot-v1 系列模型保持一致，根据模型推理的总 Tokens 计费，详情请查看：

关于token价格，详见模型推理价格说明

我们推荐图片分辨率不超过4k (4096*2160)，视频分辨率不超过2k (2048*1080)，再高的分辨率只会增加处理时间，也不会对模型理解的效果有提升。

由于我们对请求体的整体大小有限制，所以对于非常大的视频，必须使用上传文件的方式使用视觉理解功能。对于需要多次引用的图片或视频，我们推荐使用文件上传的方式使用视觉理解功能。关于上传文件的限制，请参阅文件上传文档。

图片数量限制：Vision 模型没有图片数量限制，但请确保请求的 Body 大小不超过 100M

URL 格式的图片：不支持，目前仅支持使用 base64 编码的图片内容

在 chat 文档中有一系列参数，但对于k2.5系列模型，其行为会有所不同。

我们建议用户不要手动设置这些字段，而是使用默认值

参数变动列举如下

字段	是否必须	说明	类型	取值
max_tokens	optional	聊天完成时生成的最大 token 数。	int	默认值为32k，即32768
thinking	optional	新增该参数控制模型是否启用思考。	object	默认值为`{"type": "enabled"}`. 只能为 `{"type": "enabled"}` 或 `{"type": "disabled"}`
temperature	optional	使用什么采样温度。	float	k2.5 系列模型将使用确定值 1.0，非思考模式下将使用确认值 0.6。若指定其他值，将会报错。
top_p	optional	采样方法。	float	k2.5 系列模型将使用确定值 0.95。若指定其他值，将会报错。
n	optional	为每条输入消息生成多少个结果。	int	k2.5 系列模型将使用确定值 1。若指定其他值，将会报错。
presence_penalty	optional	存在惩罚。	float	k2.5 系列模型将使用固定值 0.0。若指定其他值，将会报错。
frequency_penalty	optional	频率惩罚。	float	k2.5 系列模型将使用确定值 0.0。若指定其他值，将会报错。

模型	计费单位	输入价格（缓存命中）	输入价格（缓存未命中）	输出价格	模型上下文长度
kimi-k2.5	1M tokens	￥0.70	￥4.00	￥21.00	262,144 tokens

使用 Kimi K2.5 进行基准测试，请参考这篇基准测试最佳实践
Kimi K2.5 的最详细的 API 使用示例请见：使用 Kimi 视觉模型
在这里查看在 Claude Code, Roo Code, Cline中使用Kimi K2的方法
在这里查看如何配置使用思考模型
联网搜索是Kimi API官方提供的强大工具之一，在这里查看如何使用联网搜索，以及其他官方工具
在这里查看全部模型价格，充值与限速说明，联网搜索价格说明

Last updated on 2026年1月27日

常见问题 Kimi K2

Kimi K2.5

Kimi K2.5 模型介绍

代码能力跨越式提升

超长上下文支持

长思考能力

立即开始

调用示例

安装 OpenAI SDK

验证安装结果

图片理解代码示例

视频理解代码示例

最佳实践

支持的格式

Tokens 计算及费用

分辨率说明

上传文件还是base64

参数变动说明

模型价格

了解更多