Articles of Разбор

Нужен хороший парсер HTML на php

Нашел этот http://simplehtmldom.sourceforge.net/, но он не смог работать extracting this page http://php.net/manual/en/function.curl-setopt.php and parse it to plain html, it failed and returned a partial html page Это то, что я хочу сделать. Перейдите на страницу html и получите компоненты индивидуально (содержимое всех div и p в иерархии). Мне нравятся функции simplehtmldom, которые требуются для любого […]

Таблицы регулярных выражений, как соответствовать?

Мне нравится возвращать строки в этой таблице 01.10.2009 AN09551 [2009132] Ich bin Un.  7.500,00  Entwurf Я тоже попробовал: #.*?(.*?).*?(.*?).*?(.*?).*?#s может ли кто-нибудь помочь?

Как раскрыть не строгие HTML-документы снисходительно?

у меня еще один вопрос сегодня есть ли какие-либо анализаторы html с несинхронными анализаторами синтаксиса? насколько я вижу, такие анализаторы построены в веб-браузерах я имею в виду, что должно быть очень приятно получить парсер, который снисходительно обрабатывает входной документ, разрешая любую из следующих ситуаций, которые недействительны в xhtml и xml: не самозакрывающиеся одиночные tags. например: […]

Можно ли добавить дополнительные HTML-tags HTML (например, ) в HTML-парсер браузера?

Согласно этому недавнему вопросу , стандарт HTML 4 указывает, что закрытие тегов / является необязательным. Вопрос в том, что если вы напишете свой HTML-код, исключающий те закрывающие tags, это повлияет на объем работы, который браузер парсера браузера должен делать так или иначе? Я понимаю, что разница – даже если есть какой-либо эффект – вероятно, будет […]

Как реализовать подобный скруббер html-страницы, например, Readability или Instapaper от Arc90?

Мне интересно узнать, как очистить страницу html и представить ее красиво – удалите все беспорядки и переформатируйте основной текст в очень читаемый формат – например, http://lab.arc90.com/experiments/readability или Instapaper. Является ли это простой анализ страниц и удаление элементов, которые не входят в число ? Это обсуждалось где-то еще?

в dart разобрать HTML-строку в DOM

В дротике, Я хочу проанализировать строку « …. ” в DOM, чтобы я мог манипулировать элементом в сгенерированном DOM. Я знаю, что в JQuery существует $ .parseHTML, чтобы справиться с этим. Но я не могу найти ничего подобного в дротике. Спасибо. (Я пробовал html2lib, но выходной документ не может использовать query(“.classname”) для выбора.)

Извлеките все tags text и img из HTML в PHP.

Возможный дубликат: Лучшие методы анализа HTML с помощью PHP Для проекта мне нужно взять HTML-страницу и извлечь из нее все ее тексты и tags img и сохранить их в том же порядке, что и на веб-странице. Так, например, если веб-страница: Hi text link Я хотел бы получить эту информацию в этом формате: text – Hi […]

простой синтаксический анализ в rubyе

Возможный дубликат: Способ анализа HTML-документа в Ruby? Если в переменных результатах у меня есть: Welcome to Dotgeek.org * 1.ai….. etc Как я могу проанализировать, если возможно, без использования какого-либо драгоценного камня, название этой HTML-страницы, которое у меня теперь есть в переменной результатов?

Лучший способ parsingа недопустимого HTML в PHP

Есть ли лучший подход к анализу недействительного HTML, а затем применение Tidy на нем? Сторона Примечание: Есть некоторая ситуация, когда вы не можете иметь Tidy. Regexp также не рекомендуется для parsingа html.

Самый быстрый способ получить в PHP

Я делаю систему закладок и ищу самый быстрый (самый простой) способ получить название страницы с PHP. Было бы неплохо иметь что-то вроде $title = page_title($url)

Intereting Posts
Обнаруживать, работает ли браузер на устройстве Android или iOS. Настройка текста кнопки с помощью javascript ленивая нагрузка не работает в карусели бутстрапа отправьте форму с помощью ajax Безопасно ли слепо доверять URL-адресам изображений и выводить их в tags html img на сайте? Может ли он использоваться для ввода кода? Ярлык в качестве заголовка в категории Страница Blogger Как показать модальное всплывающее над другим модальным всплывающим окном Bootstrap3 – выровнять по вертикали метку в пределах h2 Добавленное значение Javascript удаляется, когда выбран параметр datepicker CSS скрывает полосу прокрутки, но имеет элемент прокручиваемый Угловой компонент разрушает информацию о высоте гибкой коробки для ее дочерних элементов Как сделать удивительные обновленные изменения страниц, такие как GitHub? загрузка, обработка, хранение и доставка предоставленных пользователем файлов и изображений Заблокируйте первое выпадающее меню после выбора и вставьте значения в таблицу в зависимости от второго выбора Могу ли я создать ширину таблицы HTML в процентах, но точную высоту столбца?