नया🚀 204K कॉन्टेक्स्ट के साथ 230B MoE मॉडल - ओपन सोर्स!

MiniMax-M2: कोडिंग और एजेंट वर्कफ़्लो के लिए उन्नत AI

MiniMax-M2 एक शक्तिशाली 230B पैरामीटर MoE (मिक्सचर ऑफ एक्सपर्ट्स) AI मॉडल है जो विशेष रूप से कोडिंग और बुद्धिमान एजेंट वर्कफ़्लो के लिए डिज़ाइन किया गया है। अपनी विशाल 204K कॉन्टेक्स्ट विंडो और असाधारण प्रोग्रामिंग क्षमताओं के साथ, यह लागत दक्षता बनाए रखते हुए एंटरप्राइज़-ग्रेड प्रदर्शन प्रदान करता है। Apache 2.0 लाइसेंस के तहत जारी, यह पूरी तरह से ओपन-सोर्स है और व्यावसायिक उपयोग के लिए तैयार है।

समीक्षाएं

MiniMax-M2 के बारे में लोग क्या कह रहे हैं

डेवलपर्स और AI विशेषज्ञों के YouTube वीडियो और तकनीकी समीक्षाओं से MiniMax-M2 के बारे में उनकी राय सुनें

Minimax M2 (Fully Tested): I am switching to this. Better than Claude & GLM-4.6 on Long Running Task

Minimax M2 (Fully Tested): I am switching to this. Better than Claude & GLM-4.6 on Long Running Task

230B पैरामीटर और 10B सक्रिय के साथ, मुझे लगता है कि यह स्थानीय व्यवसाय के लिए अच्छा है। M2 vs Qwen 3 235b, M2 जीतता है।

¡Nuevo MiniMax M2! Agente IA GRATIS e ILIMITADO 🚀 Trabaja SOLO por TI (¡Pruébalo ya!)

¡Nuevo MiniMax M2! Agente IA GRATIS e ILIMITADO 🚀 Trabaja SOLO por TI (¡Pruébalo ya!)

इसने मुझे एक डेटाबेस के साथ मदद की जिसमें मैं कई दिनों से फंसा था, और इसे 5 मिनट में हल कर दिया। धन्यवाद।

RIP Deepseek. हमारे पास एक नया #1 ओपन-सोर्स AI मॉडल है

RIP Deepseek. हमारे पास एक नया #1 ओपन-सोर्स AI मॉडल है

मुझे सोना है, रात के 3 बज रहे हैं... लेकिन फिर मुझे याद आता है कि AI कभी नहीं सोता।

अग्रणी AI मॉडल्स के साथ प्रदर्शन तुलना

देखें कि MiniMax-M2 मुख्य क्षमताओं और प्रदर्शन मेट्रिक्स में दुनिया के सबसे उन्नत AI मॉडल्स के खिलाफ कैसा प्रदर्शन करता है।

BenchmarksMiniMax-M2Claude Sonnet 4Claude Sonnet 4.5Gemini 2.5 ProGPT-5 (thinking)GLM-4.6Kimi K2 0905DeepSeek-V3.2
SWE-bench Verified69.472.7 *77.2 *63.8 *74.9 *68 *69.2 *67.8 *
Multi-SWE-Bench36.235.7 *44.3//3033.530.6
SWE-bench Multilingual56.556.9 *68//53.855.9 *57.9 *
Terminal-Bench46.336.4 *50 *25.3 *43.8 *40.5 *44.5 *37.7 *
ArtifactsBench66.857.3*61.557.7*73*59.854.255.8
BrowseComp4412.219.69.954.9*45.1*14.140.1*
BrowseComp-zh48.529.140.832.26549.528.847.9*
GAIA (text only)75.768.371.260.276.471.960.263.5
xbench-DeepSearch7264.6665677.8706171
HLE (w/ tools)31.820.324.528.4 *35.2 *30.4 *26.9 *27.2 *
τ²-Bench77.265.5*84.7*59.280.1*75.9*70.366.7
FinSearchComp-global65.54260.842.6*63.9*29.229.5*26.2
AgentCompany36374139.3*/353034

Performance benchmarks across different AI agent evaluation metrics

* indicates values directly from official technical reports/blogs | / indicates no data provided

त्वरित शुरुआत गाइड

SGLang के साथ 5 मिनट में MiniMax-M2 तैनात करें - शुरुआत करने का सबसे तेज़ तरीका

1

Hardware Requirements

Minimum setup for deploying MiniMax-M2:

  • Recommended: 8x NVIDIA A100 80GB
  • Alternative: 8x RTX 4090 24GB
2

Prepare Environment

Install Docker and NVIDIA Container Toolkit for GPU support

bash
# Install Docker
curl -fsSL https://get.docker.com | sh

# Install NVIDIA Container Toolkit
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker
3

Pull Model

SGLang automatically downloads the model from Hugging Face - no manual git clone needed

💡 The model will be automatically downloaded when you start the server in the next step. First run may take 2-5 minutes depending on your network speed.

4

Start Server

Launch SGLang server with one Docker command

bash
docker run --gpus all \
  -p 30000:30000 \
  -v ~/.cache/huggingface:/root/.cache/huggingface \
  --env "HF_TOKEN=<secret>" \
  lmsysorg/sglang:latest \
  python3 -m sglang.launch_server \
  --model-path MiniMaxAI/MiniMax-M2 \
  --host 0.0.0.0 \
  --port 30000
5

Verify Deployment

Test the API with a simple curl command

bash
curl http://localhost:30000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "MiniMaxAI/MiniMax-M2",
    "messages": [
      {"role": "user", "content": "Write a quick sort function in Python"}
    ]
  }'
6

Start Using

Use the OpenAI-compatible API with your favorite tools

python
from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:30000/v1",
    api_key="EMPTY"
)

response = client.chat.completions.create(
    model="MiniMaxAI/MiniMax-M2",
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

print(response.choices[0].message.content)

For complete deployment guide including SGLang and KTransformers:

View Full Deployment Documentation

MiniMax-M2 लाइव डेमो आज़माएं

MiniMax-M2 की शक्तिशाली कोड जनरेशन क्षमताओं को रियल-टाइम में अनुभव करें। प्रॉम्प्ट लिखें और AI को बुद्धिमान समझ और कॉन्टेक्स्ट जागरूकता के साथ तुरंत उच्च-गुणवत्ता वाला कोड जेनरेट करते हुए देखें।

Loading MiniMax-M1...

MiniMax-M2 की मुख्य विशेषताएं

शक्तिशाली क्षमताओं की खोज करें जो MiniMax-M2 को आधुनिक विकास वर्कफ़्लो के लिए आदर्श विकल्प बनाती हैं।

मिक्सचर ऑफ एक्सपर्ट्स आर्किटेक्चर

230B कुल पैरामीटर और 10B सक्रिय पैरामीटर के साथ उन्नत MoE डिज़ाइन, लागत-प्रभावी AI समाधानों के लिए न्यूनतम कम्प्यूटेशनल ओवरहेड के साथ अधिकतम प्रदर्शन प्रदान करता है।

अल्ट्रा-लार्ज कॉन्टेक्स्ट विंडो

उद्योग-अग्रणी 204K टोकन कॉन्टेक्स्ट विंडो महत्वपूर्ण कॉन्टेक्स्ट खोए बिना पूरे कोडबेस, जटिल दस्तावेज़ीकरण और मल्टी-फाइल प्रोजेक्ट की प्रोसेसिंग की अनुमति देता है।

बेहतर कोडिंग क्षमताएं

असाधारण सटीकता के साथ कोड जनरेशन, मल्टी-फाइल एडिटिंग, कंपाइल-रन-फिक्स लूप, डिबगिंग और टेस्ट वैलिडेशन सहित प्रोग्रामिंग कार्यों के लिए अनुकूलित।

बुद्धिमान एजेंट वर्कफ़्लो

टूल एकीकरण, निर्बाध वर्कफ़्लो ऑटोमेशन और मल्टी-स्टेप समस्या-समाधान प्रक्रियाओं को संभालने की क्षमता के साथ जटिल एजेंटिक कार्यों के लिए डिज़ाइन किया गया।

ओपन सोर्स स्वतंत्रता

Apache 2.0 लाइसेंस के तहत जारी, लाइसेंसिंग प्रतिबंधों या शुल्क के बिना व्यावसायिक उपयोग, संशोधन और वितरण के लिए पूर्ण स्वतंत्रता प्रदान करता है।

असाधारण प्रदर्शन दक्षता

समान आकार के पारंपरिक मॉडल की तुलना में केवल 8% कम्प्यूटेशनल लागत का उपयोग करते हुए वैश्विक ओपन-सोर्स मॉडल में #1 रैंक करता है।

अक्सर पूछे जाने वाले प्रश्न