В чём лучше написать парсер?

Тема в разделе "ASM, С/С++, Delphi, Java", создана пользователем RAPCorp, 8 апр 2017.

  1. jcstick

    jcstick Писатель

    Регистр.:
    20 янв 2017
    Сообщения:
    1
    Симпатии:
    0
    Я использую для парсинга xpath
    в гугл хром есть... Под линукс у меня есть скрипты готовые

    Вот пример парсинга
    Установить libxml и проверить путь к программе.
    rs=$(wget -q -O - Перейти по ссылке)
    buyUSD1=$(echo -e "$rs" | xmllint --html --xpath '//*[@id="right-column"]/div[4]/div[2]/table[1]/tbody/tr[1]/td[2]/text()' - 2>/dev/null)
    saleUSD1=$(echo -e "$rs" | xmllint --html --xpath '//*[@id="right-column"]/div[4]/div[2]/table[1]/tbody/tr[1]/td[3]/text()' - 2>/dev/null)

    buyEUR1=$(echo -e "$rs" | xmllint --html --xpath '//*[@id="right-column"]/div[4]/div[2]/table[1]/tbody/tr[3]/td[2]/text()' - 2>/dev/null)
    saleEUR1=$(echo -e "$rs" | xmllint --html --xpath '//*[@id="right-column"]/div[4]/div[2]/table[1]/tbody/tr[3]/td[3]/text()' - 2>/dev/null)

    echo buyUSD1
    echo saleUSD1

    echo buyEUR1
    echo saleEUR1
     
  2. Technik2018

    Technik2018 Писатель

    Регистр.:
    Пятница
    Сообщения:
    33
    Симпатии:
    39
    За селениум вебдрайвер уже написали, но есть и отдельная библиотека для вытаскивания данных на java

    Если делать на джаве, так делать приложение и с интерфейсом и функционалом, который покроет множество ситуация для парсинга с минимумом правок

    Тот де питон или php быстрее для конкретных случаев парсинга
     
    mr.talk34 нравится это.