Как парсить данные с сайта java

Аватар пользователя Иван Полежаев
Иван Полежаев
14 апреля 2023

Для парсинга данных с веб-сайта в Java можно использовать библиотеку Jsoup.

  • Добавьте зависимость в файл build.gradle:
dependencies {
    implementation 'org.jsoup:jsoup:1.14.3'
}
  • Создайте экземпляр класса Document, передав в качестве параметра URL адрес страницы:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import java.io.IOException;

public class Main {
    public static void main(String[] args) throws IOException {
        Document doc = Jsoup.connect("https://www.example.com/").get();
        System.out.println(doc.title());
    }
}
  • Используйте методы класса Document для получения нужных элементов страницы, например:
// Получить все ссылки на странице
Elements links = doc.select("a[href]");
for (Element link : links) {
    System.out.println(link.attr("href"));
}

// Получить текст заголовка страницы
String title = doc.title();
System.out.println(title);

Пример выше показывает, как получить все ссылки на странице и текст заголовка страницы. С помощью Jsoup вы также можете извлекать другие элементы страницы, такие как изображения, таблицы, формы и т. д.

0 0
Познакомьтесь с основами Java бесплатно

Похожие вопросы