Перейти до вмісту
    Ruby / Простий парсер веб-сторінок на Ruby

    Простий парсер веб-сторінок на Ruby

    Оцініть цю публікацію!
    [Усього: 0 Середнє значення: 0]

    Ось приклад Ruby-скрипта, який використовує гем Nokogiri для вилучення та виведення заголовків з веб-сторінки:

    require 'open-uri'
    require 'nokogiri'
    
    # URL веб-сторінки для парсингу (замініть на бажаний)
    url = 'https://example.com'
    
    # Функція для отримання заголовків сторінки
    def get_page_titles(url)
      html = open(url)
      doc = Nokogiri::HTML(html)
      titles = doc.css('h1, h2, h3').map(&:text)
      return titles
    end
    
    # Отримання та виведення заголовків
    page_titles = get_page_titles(url)
    
    puts "Заголовки сторінки:"
    puts page_titles
    

    Опис скрипта:

    1. Змінна url: Містить URL веб-сторінки, яку ви хочете спарсити. Замініть на власний.
    2. Функція get_page_titles: Використовує гем Nokogiri для парсингу HTML сторінки та вилучення заголовків з тегів h1, h2, та h3.
    3. Оформлення та виведення результатів: Заголовки сторінки виводяться у консолі.

    Цей приклад може бути використаний як основа для створення власних парсерів веб-сторінок.

    Залишити відповідь

    Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *