В чём лучше написать парсер?

Тема в разделе "ASM, С/С++, Delphi, Java", создана пользователем RAPCorp, 8 апр 2017.

  1. jcstick

    jcstick Писатель

    Регистр.:
    20 янв 2017
    Сообщения:
    1
    Симпатии:
    0
    Я использую для парсинга xpath
    в гугл хром есть... Под линукс у меня есть скрипты готовые

    Вот пример парсинга
    Установить libxml и проверить путь к программе.
    rs=$(wget -q -O - https://ru.otpbank.com.ua/)
    buyUSD1=$(echo -e "$rs" | xmllint --html --xpath '//*[@id="right-column"]/div[4]/div[2]/table[1]/tbody/tr[1]/td[2]/text()' - 2>/dev/null)
    saleUSD1=$(echo -e "$rs" | xmllint --html --xpath '//*[@id="right-column"]/div[4]/div[2]/table[1]/tbody/tr[1]/td[3]/text()' - 2>/dev/null)

    buyEUR1=$(echo -e "$rs" | xmllint --html --xpath '//*[@id="right-column"]/div[4]/div[2]/table[1]/tbody/tr[3]/td[2]/text()' - 2>/dev/null)
    saleEUR1=$(echo -e "$rs" | xmllint --html --xpath '//*[@id="right-column"]/div[4]/div[2]/table[1]/tbody/tr[3]/td[3]/text()' - 2>/dev/null)

    echo buyUSD1
    echo saleUSD1

    echo buyEUR1
    echo saleEUR1
     
  2. Technik2018

    Technik2018 Создатель

    Регистр.:
    12 янв 2018
    Сообщения:
    34
    Симпатии:
    41
    За селениум вебдрайвер уже написали, но есть и отдельная библиотека для вытаскивания данных на java

    Если делать на джаве, так делать приложение и с интерфейсом и функционалом, который покроет множество ситуация для парсинга с минимумом правок

    Тот де питон или php быстрее для конкретных случаев парсинга
     
    mr.talk34 нравится это.
  3. Ivan1212

    Ivan1212 Писатель

    Регистр.:
    28 янв 2018
    Сообщения:
    1
    Симпатии:
    0
    Я бы на C# написал, довольно простой язык и визуальная среда, если сравнивать с делфи.
     
  4. amsirion

    amsirion Создатель

    Регистр.:
    4 янв 2014
    Сообщения:
    10
    Симпатии:
    1
    Парсер на Python конечно. IDE -- pycharm. Куча готовых библиотек для этого уже есть. Самая мощная это scrapy
     
  5. BigJeff

    BigJeff Постоялец

    Регистр.:
    25 мар 2013
    Сообщения:
    56
    Симпатии:
    9
    Полностью поддерживаю, а потом всё это дело через зенку и будет то что доктор прописал.
     
  6. amsirion

    amsirion Создатель

    Регистр.:
    4 янв 2014
    Сообщения:
    10
    Симпатии:
    1
    С# это же для колхозников виндовых))
     
  7. BigJeff

    BigJeff Постоялец

    Регистр.:
    25 мар 2013
    Сообщения:
    56
    Симпатии:
    9
    Не стоит недооценивать С#
     
  8. sparsame

    sparsame Постоялец

    Регистр.:
    20 авг 2011
    Сообщения:
    98
    Симпатии:
    11
    С# через nuget содержит огромное кол-во готовых библиотек для парсинга
     
  9. orka13

    orka13 Писатель

    Регистр.:
    11 май 2015
    Сообщения:
    7
    Симпатии:
    1
    Я паршу через ZennoPoster + XPath (HTMLAgilityPack C#-библиотека). В трудных случаях еще xNet библиотеку подключаю под сложные запросы.
     
  10. Defqwe

    Defqwe Писатель

    Регистр.:
    16 мар 2018
    Сообщения:
    7
    Симпатии:
    1