Михаил
6 сообщений
#18 лет назад
Как вы решаете проблему конверта сабжа? Большинство страниц вообше не valid xhtml...
Дмитрий Вашкевич
35 сообщений
#18 лет назад
Цитата ("sharpaddict"):
Как вы решаете проблему конверта сабжа? Большинство страниц вообше не valid xhtml...

А причем тут xhtml к xml?

Если вопрос в том, что надо делать валидные xhtml-страницы, то ответ простой - надо следовать спецификации. Иногда это не получается. В таких случаях можно использовать хаки, например, вывод невалидного кода средствами javascript. Только... оно надо?
 Михаил
6 сообщений
#18 лет назад
Не, мы просто берём страницу (например любую с seclab.ru), пытаемся LoadXml(downloaded_page), вылетает эксепшын связаный с невалидным xml... А нужно как-то сделать _валидный_...
Болатов А.
1090 сообщений
#18 лет назад
sharpaddict, а ты вообще в курсе, что XML и XHTML (а уж тем более HTML) -- вещи совершенно разные?
Дмитрий Вашкевич
35 сообщений
#18 лет назад
sharpaddict,
"эксепшын связаный с невалидным xml" - и там ошибка не указана разве?
Телепатов здесь не видно.
 Михаил
6 сообщений
#18 лет назад
Цитата:
sharpaddict, а ты вообще в курсе, что XML и XHTML (а уж тем более HTML) -- вещи совершенно разные?
Как ни странно, в курсе. Возможно не так выразился...

Цитата:
"эксепшын связаный с невалидным xml" - и там ошибка не указана разве?
Телепатов здесь не видно.
Это вообще не относится к вопросу... На многих сайтах например td не закрывают... Угадай с трёх раз валидный xml или нет? А отображается - на ура.
Дмитрий Вашкевич
35 сообщений
#18 лет назад
Цитата:
Это вообще не относится к вопросу...

Потому что задачу нужно формулировать нормально. С тем же успехом я могу спросить, как вы решаете проблему с черновиками в почтовых интерфейсах?
Дмитрий Вашкевич
35 сообщений
#18 лет назад
В общем, если я понял твою задачу, то tidy:


Пример:
 Михаил
6 сообщений
#18 лет назад
Не, ни тайди, ни SgmlReader, ни MilHtmlParser (даже во всевозможных комбинациях) не могут причесать например
Дмитрий Вашкевич
35 сообщений
#18 лет назад
Код содержит ошибки, которые стандартные валидаторы не могут исправить. Это не предупреждения типа "тэг не закрыт".
Имхо, тока ручками... Писать парсер, которые учитывает возможности различных браузеров - это не парсер, который следует конкретной спецификации.
Раду М.
159 сообщений
#18 лет назад
Цитата ("alibek"):
sharpaddict, а ты вообще в курсе, что XML и XHTML (а уж тем более HTML) -- вещи совершенно разные?


Эй да, xHTML - это и есть XML
Сергей Ш.
24 сообщения
#18 лет назад
По идее, если взять HTML->SGML (приписывание HTML к конкретной схеме), а потом SGML->XML (построить XML по той же схеме, что и SGML(есть стандартный конвертор)), торезультат будет вполне корректным. Насколько я знаю, приблизительно так реализованы многие браузеры. Хотя ничего гарантировать не могу, я с SGML дела не имею.
Болатов А.
1090 сообщений
#18 лет назад
Shevron, ну тогда можно сказать, что XML -- это и есть TXT.
XHTML это разновидность XML, но строго для определенных целей. У них разное назначение, разные области использования.
Дмитрий Вашкевич
35 сообщений
#18 лет назад
Цитата:
Вы вначале утверждали что это разные вещи... а не цели. Вещи как оказалось одинаковые, в этом и суть. Кстати и XML и XHTML предназначены для одних и тех же целей: хранение и представление информации.

:shok:
Глупость. XML - для разметки и хранения данных, а XHTML - для разметки и предоставления информации. Перечитайте внимательнее ту же википедию.
Раду М.
159 сообщений
#18 лет назад
Цитата ("Churchik"):
Цитата:
Вы вначале утверждали что это разные вещи... а не цели. Вещи как оказалось одинаковые, в этом и суть. Кстати и XML и XHTML предназначены для одних и тех же целей: хранение и представление информации.

:shok:
Глупость. XML - для разметки и хранения данных, а XHTML - для разметки и предоставления информации. Перечитайте внимательнее ту же википедию.


Перечитай внимательнее ту же википедию по разделам что такое "данные" и что такое "информация".
И еще раз внимательнее про xHTML и XML.
 Михаил
6 сообщений
#18 лет назад
Бугага Правилный ответ:
Цитата:
XHTML является подмножеством XML
Читайте Маркса, там понятно изложено
Станислав Малкин
1410 сообщений
#18 лет назад
Цитата ("sharpaddict"):
Бугага Правилный ответ:
Цитата:
XHTML является подмножеством XML
Читайте Маркса, там понятно изложено


Правильный ответ:

Цитата:
XHTML является подмножеством SGML


читайте спецификации.
 Михаил
6 сообщений
#18 лет назад
Что за детский сад?
Станислав Малкин
1410 сообщений
#18 лет назад
Цитата ("sharpaddict"):
Что за детский сад?


Где Вы увидели детский сад, извините?
Тут М.
626 сообщений
#17 лет назад
Валидный xHTML является валидным XML.
Валидный HTML совсем не обязан быть валидмым XML, хотя и может.