ozzy1987
MCP Serverozzy1987public

google search scraper

一个免费的 Google 搜索爬虫系统,提供无限制搜索功能,支持 API 和服务器模式。

Repository Info

0
Stars
0
Forks
0
Watchers
0
Issues
Python
Language
Other
License

About This Server

一个免费的 Google 搜索爬虫系统,提供无限制搜索功能,支持 API 和服务器模式。

Model Context Protocol (MCP) - This server can be integrated with AI applications to provide additional context and capabilities, enabling enhanced AI interactions and functionality.

Documentation

🔍 Google Search Scraper

Búsquedas ilimitadas en Google sin restricciones ni costos de API

Un sistema completo de web scraping para realizar búsquedas en Google de forma gratuita, implementado como servidor MCP y API REST con sistema anti-detección.

🚀 Características

  • Sin limitaciones: Evita las restricciones y costos de Google Search API
  • Doble implementación: Servidor MCP + API REST con FastAPI
  • Anti-detección: Rotación automática de user agents y dominios
  • Búsqueda avanzada: Filtros por sitio, tipo de archivo, rango de fechas
  • Rate limiting inteligente: Sistema adaptativo de delays
  • Docker Ready: Despliegue fácil con contenedores
  • Proxy Nginx: Balanceador de carga y rate limiting

🛠️ Instalación Rápida

Opción 1: Docker (Recomendado)

git clone https://github.com/tu-usuario/google-search-scraper.git
cd google-search-scraper/api
docker-compose up -d

Opción 2: Instalación Manual

git clone https://github.com/tu-usuario/google-search-scraper.git
cd google-search-scraper
pip install -r requirements.txt

# Para API REST
cd api && python main.py

# Para servidor MCP
cd mcp && python google_scraper_mcp.py

📚 Uso Básico

API REST

# Búsqueda simple
curl "http://localhost:8000/search?q=python+tutorial&num=5"

# Búsqueda en sitio específico
curl "http://localhost:8000/search/site/reddit.com?q=python+tips"

# Búsqueda por tipo de archivo
curl "http://localhost:8000/search/filetype/pdf?q=machine+learning"

Respuesta de ejemplo

{
  "success": true,
  "query": "python tutorial",
  "results_count": 5,
  "results": [
    {
      "title": "Python Tutorial - Learn Python Programming",
      "url": "https://example.com/python-tutorial",
      "snippet": "Complete guide to Python programming...",
      "date": "2024-01-15",
      "position": 1
    }
  ],
  "timestamp": "2024-01-20T10:30:00",
  "source": "www.google.com"
}

🔧 Configuración Avanzada

Variables de Entorno

# .env
LOG_LEVEL=info
MAX_RESULTS=50
DELAY_MIN=1.5
DELAY_MAX=3.0
RATE_LIMIT_REQUESTS=100

Búsqueda Avanzada (POST)

{
  "query": "machine learning",
  "site": "arxiv.org",
  "filetype": "pdf",
  "date_range": "year",
  "language": "en",
  "num_results": 20,
  "safe_search": false
}

📖 Documentación

  • 📋 Uso de la API
  • ⚙️ Configuración MCP
  • 🐳 Despliegue Docker
  • 📝 Ejemplos Prácticos

🏗️ Arquitectura

┌─────────────────┐    ┌──────────────────┐    ┌─────────────────┐
│   Cliente Web   │───▶│   Nginx Proxy    │───▶│   FastAPI App   │
└─────────────────┘    └──────────────────┘    └─────────────────┘
                       ┌──────────────────┐             │
                       │   MCP Server     │◀────────────┘
                       └──────────────────┘
                       ┌──────────────────┐
                       │ Google Scraper   │
                       │ (Anti-Detection) │
                       └──────────────────┘

🛡️ Sistema Anti-Detección

  • Rotación de User Agents: 8+ user agents realistas
  • Dominios múltiples: 7 dominios de Google diferentes
  • Delays inteligentes: Sistema adaptativo basado en uso
  • Headers realistas: Simulación de navegador real
  • Manejo de errores: Recovery automático ante bloqueos

📊 Endpoints Disponibles

EndpointMétodoDescripción
/GETHealth check y información
/searchGETBúsqueda simple
/search/advancedPOSTBúsqueda con filtros avanzados
/search/site/{domain}GETBúsqueda en sitio específico
/search/filetype/{type}GETBúsqueda por tipo de archivo
/statsGETEstadísticas de uso
/resetPOSTReiniciar scraper
/docsGETDocumentación interactiva

🚨 Consideraciones Legales

Este proyecto es para uso educativo y personal. Al usar este scraper:

  • ✅ Respeta los términos de servicio de Google
  • ✅ No hagas requests masivos o abusivos
  • ✅ Implementa delays apropiados entre requests
  • ✅ Considera las implicaciones legales en tu jurisdicción

🤝 Contribuir

  1. Fork el proyecto
  2. Crea una rama para tu feature (git checkout -b feature/nueva-funcionalidad)
  3. Commit tus cambios (git commit -m 'Agregar nueva funcionalidad')
  4. Push a la rama (git push origin feature/nueva-funcionalidad)
  5. Abre un Pull Request

📄 Licencia

Este proyecto está bajo la Licencia MIT - ver LICENSE para detalles.

⭐ Support

Si este proyecto te resulta útil, considera darle una estrella ⭐ en GitHub.


Nota: Este proyecto no está afiliado con Google LLC. Es una implementación independiente para fines educativos.

Quick Start

1

Clone the repository

git clone https://github.com/ozzy1987/google-search-scraper
2

Install dependencies

cd google-search-scraper
npm install
3

Follow the documentation

Check the repository's README.md file for specific installation and usage instructions.

Repository Details

Ownerozzy1987
Repogoogle-search-scraper
LanguagePython
LicenseOther
Last fetched8/10/2025

Recommended MCP Servers

💬

Discord MCP

Enable AI assistants to seamlessly interact with Discord servers, channels, and messages.

integrationsdiscordchat
🔗

Knit MCP

Connect AI agents to 200+ SaaS applications and automate workflows.

integrationsautomationsaas
🕷️

Apify MCP Server

Deploy and interact with Apify actors for web scraping and data extraction.

apifycrawlerdata
🌐

BrowserStack MCP

BrowserStack MCP Server for automated testing across multiple browsers.

testingqabrowsers

Zapier MCP

A Zapier server that provides automation capabilities for various apps.

zapierautomation