Оцініть цю публікацію!
[Усього: 0 Середнє значення: 0]
Ось приклад Ruby-скрипта, який використовує гем Nokogiri для вилучення та виведення заголовків з веб-сторінки:
require 'open-uri'
require 'nokogiri'
# URL веб-сторінки для парсингу (замініть на бажаний)
url = 'https://example.com'
# Функція для отримання заголовків сторінки
def get_page_titles(url)
html = open(url)
doc = Nokogiri::HTML(html)
titles = doc.css('h1, h2, h3').map(&:text)
return titles
end
# Отримання та виведення заголовків
page_titles = get_page_titles(url)
puts "Заголовки сторінки:"
puts page_titles
Опис скрипта:
- Змінна
url: Містить URL веб-сторінки, яку ви хочете спарсити. Замініть на власний. - Функція
get_page_titles: Використовує гемNokogiriдля парсингу HTML сторінки та вилучення заголовків з тегівh1,h2, таh3. - Оформлення та виведення результатів: Заголовки сторінки виводяться у консолі.
Цей приклад може бути використаний як основа для створення власних парсерів веб-сторінок.