Setiap kali AI agent menjawab dengan kalimat panjang dan basa-basi, kamu membayar lebih mahal dari yang seharusnya. Satu jawaban sederhana yang dimulai dengan "Tentu saja, dengan senang hati saya akan membantu..." sudah membuang puluhan token sebelum substansi teknis dimulai. Kalikan dengan ratusan interaksi per hari, dan angkanya menjadi signifikan.
Caveman hadir dengan premis yang sederhana: why use many token when few token do trick. Plugin ini mengubah cara AI agent berkomunikasi — membuang semua filler, hedging, dan pleasantries, sambil mempertahankan semua konten teknis yang benar-benar penting. Hasilnya? Penghematan output token rata-rata 65%, dan response yang justru lebih mudah dibaca.
Mengapa Token Output Itu Penting
Banyak developer yang sadar biaya input token tapi mengabaikan output token. Padahal dalam penggunaan AI agent intensif — seperti vibe coding dengan Claude Code sepanjang hari — output token bisa mendominasi tagihan API.
Pengurangan output token memberi dua keuntungan sekaligus. Pertama, biaya API lebih rendah secara langsung. Kedua, response menjadi lebih cepat karena model menghasilkan lebih sedikit teks — dalam pengukuran nyata, Caveman menghasilkan response sekitar 3x lebih cepat dibanding mode normal.
Sebuah penelitian Maret 2026 menemukan bahwa response singkat justru meningkatkan akurasi sebesar 26 poin persentase pada beberapa tugas tertentu. Lebih pendek tidak selalu berarti lebih buruk.
Cara Install Caveman
Cara install berbeda tergantung platform yang digunakan. Berikut langkah untuk masing-masing:
Claude Code
claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman
Setelah install, Caveman aktif otomatis via SessionStart hooks. Tidak perlu konfigurasi tambahan.
Gemini CLI
gemini extensions install https://github.com/JuliusBrussee/caveman
Cursor, Windsurf, Cline, atau Copilot
npx skills add JuliusBrussee/caveman -a [nama-agent]
Ganti [nama-agent] dengan nama agent yang digunakan, misalnya cursor atau copilot. Untuk platform ini, Caveman perlu dikonfigurasi sebagai "always-on" secara manual lewat rules file agar aktif di setiap sesi.
Agent Lain (40+ platform didukung)
npx skills add JuliusBrussee/caveman
Untuk platform yang tidak mendukung hooks otomatis, salin snippet system prompt dari README Caveman ke dalam rules file agent kamu. Ini memastikan Caveman aktif di setiap sesi tanpa perlu diaktifkan manual.
Level Intensitas Kompresi
Caveman tidak hanya punya satu mode — ada empat tingkat intensitas yang bisa dipilih sesuai kebutuhan:
| Mode | Perintah | Perilaku |
|---|---|---|
| Lite | /caveman lite | Hapus filler, pertahankan grammar. Profesional tanpa basa-basi. |
| Full | /caveman full | Mode default. Artikel, fragmen kalimat dihapus, grunt maksimal. |
| Ultra | /caveman ultra | Telegrafis. Singkat semaksimal mungkin. |
| Wenyan | /caveman wenyan | Gaya prosa klasik Tiongkok. Kompresi tertinggi. |
Untuk penggunaan sehari-hari dalam vibe coding, mode Full adalah titik keseimbangan terbaik antara keterbacaan dan penghematan token.
Cara Pakai dan Cara Mematikan
Aktifkan Caveman dengan salah satu perintah berikut di dalam sesi chat:
/caveman— aktifkan mode default (Full)/caveman lite— aktifkan mode Lite/caveman ultra— aktifkan mode Ultra"talk like caveman"atau"less tokens please"— trigger berbasis teks
Intensitas yang dipilih akan bertahan sepanjang sesi hingga kamu mengubahnya atau sesi berakhir.
Untuk kembali ke mode normal, ketik "stop caveman" atau "normal mode".
Skills Tambahan yang Wajib Diketahui
Caveman punya beberapa skill tambahan yang sangat berguna dalam workflow development sehari-hari.
caveman-commit menghasilkan pesan commit singkat sesuai Conventional Commits dengan panjang maksimal 50 karakter di subject line. Cocok untuk yang ingin pesan commit bersih tanpa harus memikirkan formulasinya sendiri.
caveman-review menghasilkan komentar PR yang padat, format satu baris per temuan. Contoh output: L42: bug: user null. Add guard. — cukup untuk memahami masalah dan lokasinya tanpa paragraf panjang.
caveman-compress adalah yang paling menarik untuk penggunaan jangka panjang. Skill ini menulis ulang file memory session (seperti CLAUDE.md) menjadi versi yang lebih kompak, rata-rata mengurangi token input sebesar 46%. Semakin sering dijalankan seiring file memory bertumbuh, semakin besar penghematannya.
Jalankan compress pada file memory yang sudah besar:
/caveman:compress CLAUDE.md
Sebelum dan Sesudah: Gambaran Nyata
Untuk memberi gambaran konkret, berikut perbandingan response untuk pertanyaan yang sama:
Mode normal (69 token):
"The reason your React component is re-rendering is likely because you're passing an inline object as a prop, which creates a new reference on every render cycle. You should consider wrapping it in useMemo to prevent unnecessary re-renders."
Mode Caveman Full (19 token):
"New object ref each render. Wrap prop in
useMemo."
Konten teknis yang sama. Aksi yang sama. 73% lebih sedikit token.
Kesimpulan
Caveman bukan sekadar gimmick meme — ini adalah optimasi nyata yang berdampak langsung pada kecepatan dan biaya penggunaan AI agent. Untuk vibe coder yang berinteraksi dengan AI puluhan hingga ratusan kali sehari, penghematan 65% output token bisa berarti selisih yang cukup besar di akhir bulan. Install sekali, aktif selamanya, dan biarkan AI berbicara lebih efisien.







