Como Usar Gemini no WhatsApp com OpenClaw
TL;DR — Resumo rápido:
- Configure o Gemini no WhatsApp em menos de 10 minutos com o OpenClaw, inclusive no tier gratuito do Google.
- Aproveite a IA multimodal do Gemini (imagem, áudio, vídeo) direto na conversa — sem trocar de app.
- Atendimento 24/7, catálogo visual por foto e custo próximo de zero para começar.
O Gemini é a IA do Google, reconhecida pelas capacidades multimodais (imagem, áudio, vídeo) e pela integração com o Google Workspace. Combinado com o WhatsApp — o app de comunicação mais usado no Brasil, tanto para conversas pessoais quanto para atendimento ao cliente — você ganha uma ferramenta poderosa para atendimento 24/7, SAC automatizado e envio de briefings diários.
Neste guia você vai aprender a configurar tudo do zero com o OpenClaw, incluindo o caminho gratuito do Gemini, exemplos práticos de uso multimodal e a comparação com Claude e GPT-4 no mesmo canal.
O Que Você Vai Precisar
Antes de começar, certifique-se de ter:
- OpenClaw instalado — siga o guia de instalação (ou use o gerador de comando de instalação no topo da página, que monta o passo a passo para seu sistema operacional).
- Node.js 18+ no seu computador.
- Conta no Google AI Studio com chave de API.
- A chave gratuita funciona para começar (60 requisições/minuto).
- Um número de WhatsApp dedicado para o bot (pode ser chip pré-pago).
- WhatsApp instalado no celular para escanear o QR code inicial.
Não sabe qual modelo escolher? O comparativo de modelos ajuda a decidir entre Gemini, Claude, GPT-4 e Ollama conforme seu caso.
Passo a Passo
Passo 1: Instale o OpenClaw
Se ainda não instalou, execute:
npm install -g openclaw
openclaw init
Passo 2: Configure o Modelo (Gemini)
No arquivo openclaw.yaml, adicione a configuração do Gemini:
model:
provider: google
name: gemini-pro
apiKey: "SUA_CHAVE_GOOGLE"
Passo 3: Configure o Canal (WhatsApp)
Adicione a configuração do WhatsApp:
channels:
whatsapp:
enabled: true
phoneNumber: "+5511999999999"
Passo 4: Inicie o OpenClaw
openclaw gateway start
Passo 5: Teste a Conexão
Envie uma mensagem de teste pelo WhatsApp. Você deve receber uma resposta do Gemini em segundos.
Se algo não funcionar, verifique:
- As chaves de API estão corretas.
- O serviço do WhatsApp está configurado corretamente.
- O OpenClaw está rodando sem erros no terminal.
Consulte também o troubleshooting do WhatsApp para erros comuns de conexão.
Por que Gemini no WhatsApp?
O diferencial do Gemini não é apenas a qualidade do texto — é a multimodalidade nativa. Diferente de um chatbot de texto tradicional, o Gemini entende o que você envia por imagem, áudio e vídeo, e responde no contexto da conversa. No WhatsApp, isso abre três jornadas que nenhuma automação clássica consegue entregar sozinha:
- Atendimento com prova visual — o cliente manda a foto do produto, do erro na tela ou da peça quebrada, e a resposta já vem contextualizada.
- Resumo de áudios em segundos — em vez de transcrever à mão, o Gemini ouve o áudio e devolve um resumo acionável.
- Custo baixo para começar — o tier gratuito do Google cobre a validação do conceito antes de qualquer investimento.
Para quem já usa o OpenClaw com Claude no WhatsApp, o Gemini é a escolha natural quando o peso da conversa está em imagem e áudio, não em raciocínio longo de 200K tokens.
Exemplos Práticos
Veja como o Gemini funciona na prática no WhatsApp:
1. Catálogo Visual por WhatsApp
Um lojista usa o Gemini no WhatsApp para que clientes enviem fotos do que procuram e recebam sugestões de produtos similares do estoque.
Cliente: [envia foto de uma bolsa marrom]
Gemini (via OpenClaw): Vi a bolsa que você gostou! Encontrei opções similares no nosso catálogo:
- Bolsa Couro Caramelo — R$189 (90% similar)
- Couro sintético premium, alça ajustável
- Bolsa Tote Marrom — R$149 (85% similar)
- Maior, com compartimento para notebook
- Bolsa Crossbody Café — R$119 (75% similar)
- Menor, ideal para o dia a dia
Quer ver fotos detalhadas de alguma? Ou prefere outro estilo?
2. Resumo de Áudios e Reuniões
Um consultor recebe áudios longos de clientes pelo WhatsApp. Em vez de ouvir 5 minutos, o Gemini devolve o resumo acionável.
Cliente: [envia áudio de 4 min]
Gemini (via OpenClaw): Resumi seu áudio:
- Pedido principal: reagendar a consulta para a próxima terça e adiar o pagamento em 15 dias.
- Pendências: ele ainda precisa enviar o exame de sangue.
- Tom: calmo, sem urgência clínica.
Posso responder confirmando terça às 14h?
3. Nutricionista Virtual
Usuários enviam fotos das refeições pelo WhatsApp e o Gemini analisa o valor nutricional e faz sugestões.
Usuário: [envia foto do almoço: arroz, feijão, bife, salada]
Gemini (via OpenClaw): Analisei seu prato:
Estimativa nutricional:
- Calorias: ~650 kcal
- Proteína: ~35g (bife + feijão)
- Carboidratos: ~80g (arroz)
- Fibras: ~8g (feijão + salada)
Sugestões:
- Adicione legumes cozidos para mais vitaminas.
- Troque arroz branco por integral 2–3x por semana.
- A porção de arroz parece generosa — tente reduzir 20%.
Quer que eu acompanhe suas refeições da semana?
4. Identificador de Plantas e Pragas
Jardineiros e agricultores enviam fotos de plantas pelo WhatsApp e o Gemini identifica espécies, doenças e pragas.
Usuário: [envia foto de folha com manchas amarelas]
Gemini (via OpenClaw): Analisei a foto da sua planta:
Identificação: parece ser um tomateiro (Solanum lycopersicum).
Problema detectado: manchas amarelas com bordas marrons — provavelmente Septoriose (fungo Septoria lycopersici).
O que fazer:
- Remova as folhas afetadas imediatamente.
- Evite molhar as folhas (regue pela base).
- Aplique fungicida à base de cobre.
- Melhore a circulação de ar entre as plantas.
Prevenção: rotação de culturas e cobertura morta no solo.
Quer mais detalhes sobre alguma etapa do tratamento?
Dicas Avançadas
- Catálogo visual real: use a multimodalidade do Gemini para criar um catálogo por foto — clientes enviam a imagem do que querem e recebem sugestões do seu estoque, sem digitar nada.
- Análise de imagens em lote: o usuário envia várias fotos e o Gemini processa todas, ideal para inspeções, inventário e conferência de pedidos.
- Tier gratuito antes de pagar: valide o conceito sem custo — o Gemini Pro gratuito atende dezenas de conversas por dia. Quando escalar, o custo por conversa continua baixo (veja a tabela abaixo).
- Combine com cron e webhooks: conecte o bot a um workflow agendado para enviar briefings diários, relatórios noturnos ou lembretes automáticos.
Quanto Custa?
Custo do Gemini
O Gemini Pro tem um tier gratuito generoso: até 60 requisições por minuto. Para uso pessoal e pequenos negócios, isso costuma ser suficiente. O Gemini Ultra (concorrente do GPT-4 e Claude) custa cerca de US$7 por milhão de tokens. Custo médio por conversa: R$0,00 a R$0,20.
Custo do OpenClaw
Gratuito. O OpenClaw é 100% open-source e gratuito para sempre.
Estimativa Mensal
| Uso | Custo Estimado |
|---|---|
| Casual (10 msgs/dia) | R$5–15/mês |
| Moderado (50 msgs/dia) | R$25–60/mês |
| Intenso (100+ msgs/dia) | R$60–150/mês |
| Com Ollama (local) | R$0/mês |
FAQ
O Gemini é realmente gratuito no WhatsApp?
Sim. O Gemini Pro oferece um tier gratuito com 60 requisições por minuto no Google AI Studio. Para uso pessoal e pequenos negócios isso costuma ser suficiente. Quando precisar de mais volume, os preços pagos são competitivos e o OpenClaw segue gratuito.
Posso enviar imagens para o Gemini pelo OpenClaw?
Sim. O Gemini é multimodal e o OpenClaw suporta envio de imagens. Você pode enviar fotos de produtos, documentos escaneados, prints de erro ou screenshots para análise diretamente pelo seu canal preferido — o Gemini responde no contexto da conversa.
O Gemini funciona bem em português do Brasil?
Sim, o Gemini funciona bem em português, especialmente nas tarefas multimodais (imagem e áudio) onde se destaca. Em escrita longa e raciocínio complexo, Claude e GPT-4 ainda têm uma leve vantagem em nuances do idioma — por isso vale comparar no comparativo de modelos.
Preciso de um número de WhatsApp separado?
Recomendado. Usar um chip pré-pago dedicado evita misturar suas conversas pessoais com o bot e reduz o risco de bloqueio do número. O OpenClaw conecta via QR code, igual ao WhatsApp Web.
O que fazer se o bot parar de responder?
Verifique três pontos: (1) a chave de API do Google ainda é válida; (2) o openclaw gateway está rodando sem erros; (3) o WhatsApp não foi desconectado do celular (escaneie o QR code novamente se preciso). Para erros específicos, consulte o troubleshooting do WhatsApp.
Próximos Passos
Agora que você configurou o Gemini no WhatsApp, explore mais:
- Guia de Instalação Completo — use o gerador de comando para seu sistema operacional e canal.
- Tutoriais Práticos — projetos passo a passo com OpenClaw.
- Outros modelos no WhatsApp — compare Claude, GPT-4 e Ollama no mesmo canal.
- Outros canais para o Gemini — leve o Gemini para Telegram, Slack e Discord.
- Comparativo de modelos — decisão entre Gemini, Claude, GPT-4 e Ollama.
Pronto para começar? Configure o Gemini no WhatsApp em menos de 10 minutos com o OpenClaw — grátis, open-source e com tier gratuito do Google.