Как парсить данные с сайта java
Ответы
Иван Полежаев
14 апреля 2023
Для парсинга данных с веб-сайта в Java
можно использовать библиотеку Jsoup
.
- Добавьте зависимость в файл
build.gradle
:
dependencies {
implementation 'org.jsoup:jsoup:1.14.3'
}
- Создайте экземпляр класса
Document
, передав в качестве параметраURL
адрес страницы:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws IOException {
Document doc = Jsoup.connect("https://www.example.com/").get();
System.out.println(doc.title());
}
}
- Используйте методы класса
Document
для получения нужных элементов страницы, например:
// Получить все ссылки на странице
Elements links = doc.select("a[href]");
for (Element link : links) {
System.out.println(link.attr("href"));
}
// Получить текст заголовка страницы
String title = doc.title();
System.out.println(title);
Пример выше показывает, как получить все ссылки на странице и текст заголовка страницы. С помощью Jsoup
вы также можете извлекать другие элементы страницы, такие как изображения, таблицы, формы и т. д.
0
0