Собираю читалку простенькую, встал вопрос о форматах,
с txt все ясно, хотелось бы такую штуку как fb2 добавить, подкажите как правильно его отпарсить убрать все теги <> ?
кто то работал в таком направлении?
как правильно отпарсить fb2?
- Реклама
- Shapa
- Встал на лапы
- Сообщения: 127
- Зарегистрирован: Пт июн 20, 2008 09:38:05
- Откуда: Харьков
- Контактная информация:
Re: как правильно отпарсить fb2?
Смотря что позволяет ваша среда...
1. Регулярное выражение
2. пишем свой парсер. Верным признаком любого тега, можно считать пару открытого и закрытого и "удалять" их парами. чтоб случайно не принять текст за теги
кстати в гугле по запросу fb2 parser ....
Лично мне задача кажется реализуемой за пару часов ( написание своего парсера)
1. Регулярное выражение
2. пишем свой парсер. Верным признаком любого тега, можно считать пару открытого и закрытого и "удалять" их парами. чтоб случайно не принять текст за теги
кстати в гугле по запросу fb2 parser ....
Лично мне задача кажется реализуемой за пару часов ( написание своего парсера)
- FANTASTRON
- Это не хвост, это антенна
- Сообщения: 1345
- Зарегистрирован: Вт ноя 08, 2011 12:23:35
- Откуда: Россия, с. Дивное
- Контактная информация:
Re: как правильно отпарсить fb2?
В ворде открыть, выделить все, правой кнопкой мыши "Убрать все теги", затем идем в конец документа и убераем кракозябы, бывает половину документа занимают. Сохраняем в ворде.
Любое слишком категоричное утверждение неверно, включая и это.
