MCP Serverozzy1987public

google search scraper

一个免费的 Google 搜索爬虫系统，提供无限制搜索功能，支持 API 和服务器模式。

Repository Info

Stars

Forks

Watchers

Issues

Python

Language

Other

License

View on GitHubGitHub Download DocumentationDocs

About This Server

一个免费的 Google 搜索爬虫系统，提供无限制搜索功能，支持 API 和服务器模式。

Model Context Protocol (MCP) - This server can be integrated with AI applications to provide additional context and capabilities, enabling enhanced AI interactions and functionality.

Documentation

🔍 Google Search Scraper

Búsquedas ilimitadas en Google sin restricciones ni costos de API

Un sistema completo de web scraping para realizar búsquedas en Google de forma gratuita, implementado como servidor MCP y API REST con sistema anti-detección.

🚀 Características

✅ Sin limitaciones: Evita las restricciones y costos de Google Search API
✅ Doble implementación: Servidor MCP + API REST con FastAPI
✅ Anti-detección: Rotación automática de user agents y dominios
✅ Búsqueda avanzada: Filtros por sitio, tipo de archivo, rango de fechas
✅ Rate limiting inteligente: Sistema adaptativo de delays
✅ Docker Ready: Despliegue fácil con contenedores
✅ Proxy Nginx: Balanceador de carga y rate limiting

🛠️ Instalación Rápida

Opción 1: Docker (Recomendado)

git clone https://github.com/tu-usuario/google-search-scraper.git
cd google-search-scraper/api
docker-compose up -d

Opción 2: Instalación Manual

git clone https://github.com/tu-usuario/google-search-scraper.git
cd google-search-scraper
pip install -r requirements.txt

# Para API REST
cd api && python main.py

# Para servidor MCP
cd mcp && python google_scraper_mcp.py

📚 Uso Básico

API REST

# Búsqueda simple
curl "http://localhost:8000/search?q=python+tutorial&num=5"

# Búsqueda en sitio específico
curl "http://localhost:8000/search/site/reddit.com?q=python+tips"

# Búsqueda por tipo de archivo
curl "http://localhost:8000/search/filetype/pdf?q=machine+learning"

Respuesta de ejemplo

{
  "success": true,
  "query": "python tutorial",
  "results_count": 5,
  "results": [
    {
      "title": "Python Tutorial - Learn Python Programming",
      "url": "https://example.com/python-tutorial",
      "snippet": "Complete guide to Python programming...",
      "date": "2024-01-15",
      "position": 1
    }
  ],
  "timestamp": "2024-01-20T10:30:00",
  "source": "www.google.com"
}

🔧 Configuración Avanzada

Variables de Entorno

# .env
LOG_LEVEL=info
MAX_RESULTS=50
DELAY_MIN=1.5
DELAY_MAX=3.0
RATE_LIMIT_REQUESTS=100

Búsqueda Avanzada (POST)

{
  "query": "machine learning",
  "site": "arxiv.org",
  "filetype": "pdf",
  "date_range": "year",
  "language": "en",
  "num_results": 20,
  "safe_search": false
}

📖 Documentación

📋 Uso de la API
⚙️ Configuración MCP
🐳 Despliegue Docker
📝 Ejemplos Prácticos

🏗️ Arquitectura

┌─────────────────┐    ┌──────────────────┐    ┌─────────────────┐
│   Cliente Web   │───▶│   Nginx Proxy    │───▶│   FastAPI App   │
└─────────────────┘    └──────────────────┘    └─────────────────┘
                                                         │
                       ┌──────────────────┐             │
                       │   MCP Server     │◀────────────┘
                       └──────────────────┘
                                │
                       ┌──────────────────┐
                       │ Google Scraper   │
                       │ (Anti-Detection) │
                       └──────────────────┘

🛡️ Sistema Anti-Detección

Rotación de User Agents: 8+ user agents realistas
Dominios múltiples: 7 dominios de Google diferentes
Delays inteligentes: Sistema adaptativo basado en uso
Headers realistas: Simulación de navegador real
Manejo de errores: Recovery automático ante bloqueos

📊 Endpoints Disponibles

Endpoint	Método	Descripción
`/`	GET	Health check y información
`/search`	GET	Búsqueda simple
`/search/advanced`	POST	Búsqueda con filtros avanzados
`/search/site/{domain}`	GET	Búsqueda en sitio específico
`/search/filetype/{type}`	GET	Búsqueda por tipo de archivo
`/stats`	GET	Estadísticas de uso
`/reset`	POST	Reiniciar scraper
`/docs`	GET	Documentación interactiva

🚨 Consideraciones Legales

Este proyecto es para uso educativo y personal. Al usar este scraper:

✅ Respeta los términos de servicio de Google
✅ No hagas requests masivos o abusivos
✅ Implementa delays apropiados entre requests
✅ Considera las implicaciones legales en tu jurisdicción

🤝 Contribuir

Fork el proyecto
Crea una rama para tu feature (git checkout -b feature/nueva-funcionalidad)
Commit tus cambios (git commit -m 'Agregar nueva funcionalidad')
Push a la rama (git push origin feature/nueva-funcionalidad)
Abre un Pull Request

📄 Licencia

Este proyecto está bajo la Licencia MIT - ver LICENSE para detalles.

⭐ Support

Si este proyecto te resulta útil, considera darle una estrella ⭐ en GitHub.

Nota: Este proyecto no está afiliado con Google LLC. Es una implementación independiente para fines educativos.

Quick Start

Clone the repository

git clone https://github.com/ozzy1987/google-search-scraper

Install dependencies

cd google-search-scraper
npm install

Follow the documentation

Check the repository's README.md file for specific installation and usage instructions.

Repository Details

Ownerozzy1987

Repogoogle-search-scraper

LanguagePython

LicenseOther

Last fetched8/10/2025

Quick Links

Issues

Releases

License

Recommended MCP Servers

💬

Discord MCP

Enable AI assistants to seamlessly interact with Discord servers, channels, and messages.

integrationsdiscordchat

🔗

Knit MCP

Connect AI agents to 200+ SaaS applications and automate workflows.

integrationsautomationsaas

🕷️

Apify MCP Server

Deploy and interact with Apify actors for web scraping and data extraction.

apifycrawlerdata

🌐

BrowserStack MCP

BrowserStack MCP Server for automated testing across multiple browsers.

testingqabrowsers

⚡

Zapier MCP

A Zapier server that provides automation capabilities for various apps.

zapierautomation