Оцініть цю публікацію!
[Усього: 0 Середнє значення: 0]
Ось приклад Ruby-скрипта, який використовує гем Nokogiri
для вилучення та виведення заголовків з веб-сторінки:
require 'open-uri' require 'nokogiri' # URL веб-сторінки для парсингу (замініть на бажаний) url = 'https://example.com' # Функція для отримання заголовків сторінки def get_page_titles(url) html = open(url) doc = Nokogiri::HTML(html) titles = doc.css('h1, h2, h3').map(&:text) return titles end # Отримання та виведення заголовків page_titles = get_page_titles(url) puts "Заголовки сторінки:" puts page_titles
Опис скрипта:
- Змінна
url
: Містить URL веб-сторінки, яку ви хочете спарсити. Замініть на власний. - Функція
get_page_titles
: Використовує гемNokogiri
для парсингу HTML сторінки та вилучення заголовків з тегівh1
,h2
, таh3
. - Оформлення та виведення результатів: Заголовки сторінки виводяться у консолі.
Цей приклад може бути використаний як основа для створення власних парсерів веб-сторінок.