Caveman: Hemat Token AI 65%
TutorialAI ToolsDeveloper Tools#ai#productivity#claude-code#ai-coding

Caveman: Hemat Token AI 65%

A
Abd. Asis
Bagikan:

Setiap kali AI agent menjawab dengan kalimat panjang dan basa-basi, kamu membayar lebih mahal dari yang seharusnya. Satu jawaban sederhana yang dimulai dengan "Tentu saja, dengan senang hati saya akan membantu..." sudah membuang puluhan token sebelum substansi teknis dimulai. Kalikan dengan ratusan interaksi per hari, dan angkanya menjadi signifikan.

Caveman hadir dengan premis yang sederhana: why use many token when few token do trick. Plugin ini mengubah cara AI agent berkomunikasi — membuang semua filler, hedging, dan pleasantries, sambil mempertahankan semua konten teknis yang benar-benar penting. Hasilnya? Penghematan output token rata-rata 65%, dan response yang justru lebih mudah dibaca.

Mengapa Token Output Itu Penting

Banyak developer yang sadar biaya input token tapi mengabaikan output token. Padahal dalam penggunaan AI agent intensif — seperti vibe coding dengan Claude Code sepanjang hari — output token bisa mendominasi tagihan API.

Pengurangan output token memberi dua keuntungan sekaligus. Pertama, biaya API lebih rendah secara langsung. Kedua, response menjadi lebih cepat karena model menghasilkan lebih sedikit teks — dalam pengukuran nyata, Caveman menghasilkan response sekitar 3x lebih cepat dibanding mode normal.

Sebuah penelitian Maret 2026 menemukan bahwa response singkat justru meningkatkan akurasi sebesar 26 poin persentase pada beberapa tugas tertentu. Lebih pendek tidak selalu berarti lebih buruk.

Cara Install Caveman

Cara install berbeda tergantung platform yang digunakan. Berikut langkah untuk masing-masing:

Claude Code

BashBASH
claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman

Setelah install, Caveman aktif otomatis via SessionStart hooks. Tidak perlu konfigurasi tambahan.

Gemini CLI

BashBASH
gemini extensions install https://github.com/JuliusBrussee/caveman

Cursor, Windsurf, Cline, atau Copilot

BashBASH
npx skills add JuliusBrussee/caveman -a [nama-agent]

Ganti [nama-agent] dengan nama agent yang digunakan, misalnya cursor atau copilot. Untuk platform ini, Caveman perlu dikonfigurasi sebagai "always-on" secara manual lewat rules file agar aktif di setiap sesi.

Agent Lain (40+ platform didukung)

BashBASH
npx skills add JuliusBrussee/caveman

Untuk platform yang tidak mendukung hooks otomatis, salin snippet system prompt dari README Caveman ke dalam rules file agent kamu. Ini memastikan Caveman aktif di setiap sesi tanpa perlu diaktifkan manual.

Level Intensitas Kompresi

Caveman tidak hanya punya satu mode — ada empat tingkat intensitas yang bisa dipilih sesuai kebutuhan:

ModePerintahPerilaku
Lite/caveman liteHapus filler, pertahankan grammar. Profesional tanpa basa-basi.
Full/caveman fullMode default. Artikel, fragmen kalimat dihapus, grunt maksimal.
Ultra/caveman ultraTelegrafis. Singkat semaksimal mungkin.
Wenyan/caveman wenyanGaya prosa klasik Tiongkok. Kompresi tertinggi.

Untuk penggunaan sehari-hari dalam vibe coding, mode Full adalah titik keseimbangan terbaik antara keterbacaan dan penghematan token.

Cara Pakai dan Cara Mematikan

Aktifkan Caveman dengan salah satu perintah berikut di dalam sesi chat:

  • /caveman — aktifkan mode default (Full)
  • /caveman lite — aktifkan mode Lite
  • /caveman ultra — aktifkan mode Ultra
  • "talk like caveman" atau "less tokens please" — trigger berbasis teks

Intensitas yang dipilih akan bertahan sepanjang sesi hingga kamu mengubahnya atau sesi berakhir.

Untuk kembali ke mode normal, ketik "stop caveman" atau "normal mode".

Skills Tambahan yang Wajib Diketahui

Caveman punya beberapa skill tambahan yang sangat berguna dalam workflow development sehari-hari.

caveman-commit menghasilkan pesan commit singkat sesuai Conventional Commits dengan panjang maksimal 50 karakter di subject line. Cocok untuk yang ingin pesan commit bersih tanpa harus memikirkan formulasinya sendiri.

caveman-review menghasilkan komentar PR yang padat, format satu baris per temuan. Contoh output: L42: bug: user null. Add guard. — cukup untuk memahami masalah dan lokasinya tanpa paragraf panjang.

caveman-compress adalah yang paling menarik untuk penggunaan jangka panjang. Skill ini menulis ulang file memory session (seperti CLAUDE.md) menjadi versi yang lebih kompak, rata-rata mengurangi token input sebesar 46%. Semakin sering dijalankan seiring file memory bertumbuh, semakin besar penghematannya.

Jalankan compress pada file memory yang sudah besar:

BashBASH
/caveman:compress CLAUDE.md

Sebelum dan Sesudah: Gambaran Nyata

Untuk memberi gambaran konkret, berikut perbandingan response untuk pertanyaan yang sama:

Mode normal (69 token):

"The reason your React component is re-rendering is likely because you're passing an inline object as a prop, which creates a new reference on every render cycle. You should consider wrapping it in useMemo to prevent unnecessary re-renders."

Mode Caveman Full (19 token):

"New object ref each render. Wrap prop in useMemo."

Konten teknis yang sama. Aksi yang sama. 73% lebih sedikit token.

Kesimpulan

Caveman bukan sekadar gimmick meme — ini adalah optimasi nyata yang berdampak langsung pada kecepatan dan biaya penggunaan AI agent. Untuk vibe coder yang berinteraksi dengan AI puluhan hingga ratusan kali sehari, penghematan 65% output token bisa berarti selisih yang cukup besar di akhir bulan. Install sekali, aktif selamanya, dan biarkan AI berbicara lebih efisien.

Referensi

  1. 1 juliusbrussee/caveman — GitHub Repository
  2. 2 Think Smarter, Not Harder: Adaptive Reasoning with Inference-Time Compute — arXiv 2026
  3. 3 Claude Code Plugins — Dokumentasi Resmi Anthropic
Abd. Asis
Ditulis oleh
Abd. Asis

Software Developer dari Madura. Menulis tentang PHP, Laravel, dan pengembangan web modern dalam Bahasa Indonesia.