Слияние версий документа. Долблюсь дальше:(

Sikoz 01.02.2005 11:58

задача: есть две версии документа, одну сделал Вася, другую Петя. Они оба использовали для модификации версию Акакия. Как сделать, чтобы правки и Васи, и Пети автоматически поместились в один документ?

Народ советует rsync: http://citforum.proc.ru/nets/articles/rsync/
Текст можно резать lsplit'ом, хэшировать куски с помощью math:crypt или md5. По сравнению с условиями для того алгоритма имеем в плюсе наличие небольших документов и следовательно - некритичность к ресурсам.
Чего я не понял: как сделать, чтобы этот алгоритм работал не только до первого найденного различия, а до всех, и уверенно находил общий текст после различий? Ведь происходит смещение шага.

Вариант второй:
Берем во всех текстах последовательности слов (например, по 10 слов) и их хэшируем с перехлестом по 1 слову (т.е. сначала с 1 по 10 слова, затем со 2 по 11, с 3 по 12 и т.д.)

$tab_Vasya[^Vasya_text.split[v; ]]
$Vasya_hash[
  $.1[^math:md5[^getrows[$tab_Vasya;1;10]]]
  $.2[...]
]

По идее, таких хэшей может быть сколько угодно. При этом последний по времени обладает большим приоритетом.
За достоверность ключа ручаются два положения:
1) происходит последовательный перебор от начала к концу
2) если в двух документах, один из которых унаследован от другого, повторяются фразы из 20 слов (перебор-то последовательный, значит 10 + 10), то эти фразы относятся к одной и той же смысловой части документа.
Тут вопрос такой: наверняка не я первый придумал этот алгоритм, и где-то уже есть его описание со всеми подводными камнями - мож кто знает?

P.S. Понимаю, что это не тривиальная для парсера задача, но полноценной CMS без нее не сделать. А хочется, ибо остальное уже готово и скоро будет доступно по GNU GPL.

Слияние версий документа. Долблюсь дальше:(, Sikoz 01.02.2005 11:58
- А поставить CVS/SVN и прикрутить к нему разумный интерфейс не правильнее ли? (-), Sanja v.2 [M] 01.02.2005 14:55
  - У нас именно так и работает +, Sikoz 01.02.2005 15:04
    - факт, Александр Петросян (PAF) [M] 01.02.2005 15:24
      - Да. Спасибо. (-), Sikoz 01.02.2005 15:46
- Пример:, Oleg 01.02.2005 12:55
  - Ответ, Sikoz 01.02.2005 13:11
    - Ответ, Oleg 01.02.2005 13:37
      - Ответ, Sikoz 01.02.2005 14:02
        это проблемы и ваши тоже, Александр Петросян (PAF) [M] 01.02.2005 15:23
        Без diff'a это делается очень легко (-), Sikoz 01.02.2005 15:46
- А не проще ли запретить одновременное редактирование?, Luzhnikovskiy [M] 01.02.2005 12:30
  - например, Sikoz 01.02.2005 13:08
    - Re: например ...слить, yet 01.02.2005 19:40
      - Ответ, Sikoz 02.02.2005 10:50

Новости	FAQ	Авторы	Документация	В действии	Библиотека
Инструменты	Полезные ссылки	Хостинги	Скачать	Примеры	Форум