Hồ sơ suy luận

NemoClaw đi kèm với một hồ sơ suy luận được định nghĩa trong blueprint.yaml. Hồ sơ cấu hình nhà cung cấp suy luận OpenShell và tuyến mô hình. Tác nhân bên trong sandbox sử dụng mô hình nào đang hoạt động. Các yêu cầu suy luận được định tuyến một cách minh bạch qua gateway OpenShell.

Tóm tắt hồ sơ

Hồ sơ	Nhà cung cấp	Mô hình	Endpoint	Trường hợp sử dụng
`default`	NVIDIA cloud	`nvidia/nemotron-3-super-120b-a12b`	`integrate.api.nvidia.com`	Sản xuất. Yêu cầu API key NVIDIA.

Các mô hình khả dụng

Nhà cung cấp nvidia-nim đăng ký các mô hình sau từ build.nvidia.com:

Model ID	Nhãn	Cửa sổ ngữ cảnh	Đầu ra tối đa
`nvidia/nemotron-3-super-120b-a12b`	Nemotron 3 Super 120B	131.072	8.192
`nvidia/llama-3.1-nemotron-ultra-253b-v1`	Nemotron Ultra 253B	131.072	4.096
`nvidia/llama-3.3-nemotron-super-49b-v1.5`	Nemotron Super 49B v1.5	131.072	4.096
`nvidia/nemotron-3-nano-30b-a3b`	Nemotron 3 Nano 30B	131.072	4.096

Hồ sơ mặc định sử dụng Nemotron 3 Super 120B. Bạn có thể chuyển sang bất kỳ mô hình nào trong danh mục trong thời gian chạy.

`default` — NVIDIA Cloud

Hồ sơ mặc định định tuyến suy luận đến API được lưu trữ của NVIDIA thông qua build.nvidia.com.

Loại nhà cung cấp: nvidia
Endpoint: https://integrate.api.nvidia.com/v1
Mô hình: nvidia/nemotron-3-super-120b-a12b
Thông tin xác thực: Biến môi trường NVIDIA_API_KEY

Lấy API key từ build.nvidia.com. Lệnh nemoclaw onboard yêu cầu khóa này và lưu vào ~/.nemoclaw/credentials.json.

$ openshell inference set --provider nvidia-nim --model nvidia/nemotron-3-super-120b-a12b

Chuyển đổi mô hình trong thời gian chạy

Sau khi sandbox đang chạy, chuyển đổi mô hình bằng CLI OpenShell:

$ openshell inference set --provider nvidia-nim --model <model-name>

Thay đổi có hiệu lực ngay lập tức. Không cần khởi động lại sandbox.

Hồ sơ suy luận

Tóm tắt hồ sơ

Các mô hình khả dụng

default — NVIDIA Cloud

Chuyển đổi mô hình trong thời gian chạy

`default` — NVIDIA Cloud