Scrape API
Извлеките чистый, структурированный контент с любой веб-страницы.
Эндпоинт
POST https://api.firecrawl.ru/api/v1/scrape
 
Аутентификация
Требуется API ключ в одном из форматов:
# Вариант 1: X-API-Key заголовок (рекомендуемый)
X-API-Key: YOUR_API_KEY
# Вариант 2: Bearer токен
Authorization: Bearer YOUR_API_KEY
# Вариант 3: Query параметр
?api_key=YOUR_API_KEY
 
Параметры запроса
URL страницы для парсинга
 
formats
array
default:"[\"markdown\"]"
Форматы данных для извлечения. Возможные значения: markdown, html, json, links, screenshot
 
Извлекать только основной контент, исключая навигацию и боковые панели
 
HTML теги для включения в результат (например, ["h1", "p", "div"])
 
HTML теги для исключения из результата (например, ["script", "style"])
 
Таймаут запроса в миллисекундах
 
Максимальный возраст кэша в миллисекундах
 
Тип прокси для использования. Возможные значения: stealth, default
 
Попробовать сначала локальный парсер, затем облачный при неудаче
 
Принудительно использовать только локальный парсер
 
Принудительно использовать только облачный парсер
 
Пример запроса
curl -X POST https://api.firecrawl.ru/api/v1/scrape \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "url": "https://example.com",
    "formats": ["markdown", "html"],
    "onlyMainContent": true,
    "excludeTags": ["script", "style", "nav"]
  }'
 
Ответ
Указывает, был ли запрос успешным
 
URL обработанной страницы
 
Извлеченные данные со страницы
Контент страницы в формате Markdown
Структурированные данные (если доступны)
Массив найденных ссылок на странице
Base64 строка скриншота страницы (если запрошен)
Метаданные страницы
Итоговый URL после редиректов
   
Источник парсинга: local или cloud
 
Время обработки в миллисекундах
 
Сообщение об ошибке (если произошла ошибка)
 
Пример успешного ответа
{
  "success": true,
  "url": "https://example.com",
  "data": {
    "markdown": "# Пример сайта\n\nЭто пример веб-страницы с различным контентом...",
    "html": "<h1>Пример сайта</h1>\n<p>Это пример веб-страницы с различным контентом...</p>",
    "links": [
      "https://example.com/page1",
      "https://example.com/page2"
    ],
    "metadata": {
      "title": "Пример сайта - Главная страница",
      "description": "Это пример веб-сайта для демонстрации",
      "statusCode": 200,
      "loadTime": 1234,
      "sourceURL": "https://example.com",
      "language": "ru"
    }
  },
  "source": "local",
  "processingTime": 856
}
 
Коды ошибок
Неверные параметры запроса
 
Неверный или отсутствующий API ключ
 
Недостаточно прав или превышен лимит плана
 
Превышен таймаут обработки
 
Внутренняя ошибка сервера
 
Пример ошибки
{
  "success": false,
  "url": "https://example.com",
  "error": "Таймаут загрузки страницы",
  "source": "local",
  "processingTime": 30000
}