Vorstellung, wie man HTML-Meta-Tags und Meta-Keywords, die für SEO verwendet werden, mit Nokogiri extrahiert, einer Scraping-Bibliothek in der Programmiersprache Ruby.
doc = Nokogiri::HTML(page.body)
doc.at("meta[name='keywords']")['content']
# oder
doc.xpath('//meta[@name="keywords"]/@content').text
Das obige Programm wird in den folgenden Schritten ausgeführt:
- HTML mit der Nokogiri::HTML-Methode parsen
- Das Element mit dem name-Attribut des Meta-Tags als keywords mit der at-Methode abrufen
- Den Wert des content-Attributs abrufen
Um das Element mit dem name-Attribut des Meta-Tags als description abzurufen, verwenden Sie Folgendes:
doc.at("meta[name='description']")['content']