Как удалить дубликаты строк регуляркой?

Тема в разделе "Регулярные выражения", создана пользователем cocs, 15 окт 2017.

  1. gradar

    gradar Постоялец

    Регистр.:
    15 авг 2015
    Сообщения:
    123
    Симпатии:
    74
    upload_2017-11-16_20-55-31.png
     
    romas_s нравится это.
  2. Seegr

    Seegr Писатель

    Регистр.:
    23 июн 2016
    Сообщения:
    2
    Симпатии:
    0
    я в экселе миллион строк сортировал и удалял дубли - очень удобно и достаточно быстро.
    Для более миллиона строк использую App.Merge.exe - брать с hasller
     
  3. byNickSan

    byNickSan Создатель

    Регистр.:
    29 ноя 2017
    Сообщения:
    12
    Симпатии:
    5
    KeyWordKeeper юзаю, так проще для больших файлов
     
  4. yr4ik_07

    yr4ik_07 Создатель

    Регистр.:
    29 июн 2015
    Сообщения:
    11
    Симпатии:
    3
    Если знаете php то:
    1) Берем строки через file
    2) далее массив строк пропускаем через array_count_values
    3) на выходе имеем массив вида:
    значение1 => 2,
    значeние2 => 3,
    значeние3 => 1

    где ключами будут уникальные строки, а значениями их количество
     
  5. soll2307

    soll2307 Постоялец

    Регистр.:
    27 июл 2009
    Сообщения:
    88
    Симпатии:
    7
    string result = Regex.Replace(input, @"(?m)^(.+)(?=\s+^\1)", ""); //(на сишарпе)
     
  6. Insendio

    Insendio Создатель

    Регистр.:
    21 апр 2018
    Сообщения:
    10
    Симпатии:
    6
    Вариант без regex:
    AkelPad -> Преобразовать -> Удалить дублирующиеся строки, есть еще и другие варианты:
    [​IMG]
     
  7. twocher

    twocher Создатель

    Регистр.:
    17 мар 2018
    Сообщения:
    17
    Симпатии:
    3
    Да вы батенька или маньяк или трепач. Excel просто технически начинает тупить при заполнении большого количества ячеек.