Caveman: Hemat Token AI 65%

Setiap kali AI agent menjawab dengan kalimat panjang dan basa-basi, kamu membayar lebih mahal dari yang seharusnya. Satu jawaban sederhana yang dimulai dengan "Tentu saja, dengan senang hati saya akan membantu..." sudah membuang puluhan token sebelum substansi teknis dimulai. Kalikan dengan ratusan interaksi per hari, dan angkanya menjadi signifikan.

Caveman hadir dengan premis yang sederhana: why use many token when few token do trick. Plugin ini mengubah cara AI agent berkomunikasi — membuang semua filler, hedging, dan pleasantries, sambil mempertahankan semua konten teknis yang benar-benar penting. Hasilnya? Penghematan output token rata-rata 65%, dan response yang justru lebih mudah dibaca.

Mengapa Token Output Itu Penting

Banyak developer yang sadar biaya input token tapi mengabaikan output token. Padahal dalam penggunaan AI agent intensif — seperti vibe coding dengan Claude Code sepanjang hari — output token bisa mendominasi tagihan API.

Pengurangan output token memberi dua keuntungan sekaligus. Pertama, biaya API lebih rendah secara langsung. Kedua, response menjadi lebih cepat karena model menghasilkan lebih sedikit teks — dalam pengukuran nyata, Caveman menghasilkan response sekitar 3x lebih cepat dibanding mode normal.

Sebuah penelitian Maret 2026 menemukan bahwa response singkat justru meningkatkan akurasi sebesar 26 poin persentase pada beberapa tugas tertentu. Lebih pendek tidak selalu berarti lebih buruk.

Cara Install Caveman

Cara install berbeda tergantung platform yang digunakan. Berikut langkah untuk masing-masing:

Claude Code

claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman

Setelah install, Caveman aktif otomatis via SessionStart hooks. Tidak perlu konfigurasi tambahan.

Gemini CLI

gemini extensions install https://github.com/JuliusBrussee/caveman

Cursor, Windsurf, Cline, atau Copilot

npx skills add JuliusBrussee/caveman -a [nama-agent]

Ganti [nama-agent] dengan nama agent yang digunakan, misalnya cursor atau copilot. Untuk platform ini, Caveman perlu dikonfigurasi sebagai "always-on" secara manual lewat rules file agar aktif di setiap sesi.

Agent Lain (40+ platform didukung)

npx skills add JuliusBrussee/caveman

Untuk platform yang tidak mendukung hooks otomatis, salin snippet system prompt dari README Caveman ke dalam rules file agent kamu. Ini memastikan Caveman aktif di setiap sesi tanpa perlu diaktifkan manual.

Level Intensitas Kompresi

Caveman tidak hanya punya satu mode — ada empat tingkat intensitas yang bisa dipilih sesuai kebutuhan:

Mode	Perintah	Perilaku
Lite	`/caveman lite`	Hapus filler, pertahankan grammar. Profesional tanpa basa-basi.
Full	`/caveman full`	Mode default. Artikel, fragmen kalimat dihapus, grunt maksimal.
Ultra	`/caveman ultra`	Telegrafis. Singkat semaksimal mungkin.
Wenyan	`/caveman wenyan`	Gaya prosa klasik Tiongkok. Kompresi tertinggi.

Untuk penggunaan sehari-hari dalam vibe coding, mode Full adalah titik keseimbangan terbaik antara keterbacaan dan penghematan token.

Cara Pakai dan Cara Mematikan

Aktifkan Caveman dengan salah satu perintah berikut di dalam sesi chat:

/caveman — aktifkan mode default (Full)
/caveman lite — aktifkan mode Lite
/caveman ultra — aktifkan mode Ultra
"talk like caveman" atau "less tokens please" — trigger berbasis teks

Intensitas yang dipilih akan bertahan sepanjang sesi hingga kamu mengubahnya atau sesi berakhir.

Untuk kembali ke mode normal, ketik "stop caveman" atau "normal mode".

Skills Tambahan yang Wajib Diketahui

Caveman punya beberapa skill tambahan yang sangat berguna dalam workflow development sehari-hari.

caveman-commit menghasilkan pesan commit singkat sesuai Conventional Commits dengan panjang maksimal 50 karakter di subject line. Cocok untuk yang ingin pesan commit bersih tanpa harus memikirkan formulasinya sendiri.

caveman-review menghasilkan komentar PR yang padat, format satu baris per temuan. Contoh output: L42: bug: user null. Add guard. — cukup untuk memahami masalah dan lokasinya tanpa paragraf panjang.

caveman-compress adalah yang paling menarik untuk penggunaan jangka panjang. Skill ini menulis ulang file memory session (seperti CLAUDE.md) menjadi versi yang lebih kompak, rata-rata mengurangi token input sebesar 46%. Semakin sering dijalankan seiring file memory bertumbuh, semakin besar penghematannya.

Jalankan compress pada file memory yang sudah besar:

/caveman:compress CLAUDE.md

Sebelum dan Sesudah: Gambaran Nyata

Untuk memberi gambaran konkret, berikut perbandingan response untuk pertanyaan yang sama:

Mode normal (69 token):

"The reason your React component is re-rendering is likely because you're passing an inline object as a prop, which creates a new reference on every render cycle. You should consider wrapping it in useMemo to prevent unnecessary re-renders."

Mode Caveman Full (19 token):

"New object ref each render. Wrap prop in useMemo."

Konten teknis yang sama. Aksi yang sama. 73% lebih sedikit token.

Kesimpulan

Caveman bukan sekadar gimmick meme — ini adalah optimasi nyata yang berdampak langsung pada kecepatan dan biaya penggunaan AI agent. Untuk vibe coder yang berinteraksi dengan AI puluhan hingga ratusan kali sehari, penghematan 65% output token bisa berarti selisih yang cukup besar di akhir bulan. Install sekali, aktif selamanya, dan biarkan AI berbicara lebih efisien.

Caveman: Hemat Token AI 65%

Mengapa Token Output Itu Penting

Cara Install Caveman

Claude Code

Gemini CLI

Cursor, Windsurf, Cline, atau Copilot

Agent Lain (40+ platform didukung)

Level Intensitas Kompresi

Cara Pakai dan Cara Mematikan

Skills Tambahan yang Wajib Diketahui

Sebelum dan Sesudah: Gambaran Nyata

Kesimpulan

Referensi

Artikel Terkait

VibeUI: Library Prompt UI untuk Vibe Coder

Rekayasa Perangkat Lunak Terbagi Tiga

10 Trik Golang untuk Developer Produktif

Hapus Watermark dengan AI Python

AgentRouter: Claude Code Gratis $200

Laravel Boost: MCP Server untuk AI-Assisted Development di Laravel