Articles of regex

Поиск в HTML-странице с использованием шаблонов Regex с помощью python

Я пытаюсь найти строку внутри HTML-страницы с известными шаблонами. например, в следующем HTML-коде:   ( 1 of 1 ) String 1 String String 2. String 3 String 4 … Я хочу найти String 4 , и я знаю, что он всегда будет между и как я могу искать строку с помощью RE? редактировать: Я пробовал […]

Разделить строку на объекты HTML?

В моей строке содержится много объектов HTML, например & # X22; Привет & NBSP; & Lt; все & GT; & NBSP; там & # x22; И я хочу разбить его на объекты HTML: Здравствуйте все там Может ли кто-нибудь предложить мне способ сделать это, пожалуйста? Может использоваться Regex?

RegEx для отклонения неэкранированного символа HTML

Я хочу ограничить использование неэксклюзивных амперсандов в определенном поле ввода. У меня возникли проблемы с получением RegEx, чтобы убить использование «&», если не следовать «amp;» … или просто ограничить использование «&» (обратите внимание на пробел). Я попытался адаптировать ответ в этой теме , но безрезультатно. Благодарю. (FWIW, вот RegEx, который я сделал, чтобы гарантировать, что […]

Как выполнить поиск определенного текста в тексте HTML и выделить строку поиска цветом

У нас есть требование для поиска по тексту HTML и выделения текста с определенным цветом. Пример: строка html Giving this flyer to your class customers В приведенном выше тексте я ищу слово «class». Он должен выделить текстовый class в тексте «Предоставление этого флаера вашим клиентам classа». Но в то время как он пытается выделить элемент […]

Получение атрибута href и текста определенных типов ссылок

Из этих четырех ссылок: Albano Y Romina Power Armando Manzanero Banda Cuisillos Baladas Alternativas Я пытаюсь захватить значение href и текст ссылки трех первых, оставив четвертую ссылку, другими словами, я пытаюсь получить это: https://stackoverflow.com/questions/23305739/getting-the-href-attribute-and-text-of-certain-kind-of-links/escuchar-baladas-de-Albano_Y_Romina_Power.html Albano Y Romina Power https://stackoverflow.com/questions/23305739/getting-the-href-attribute-and-text-of-certain-kind-of-links/escuchar-baladas-de-Armando_Manzanero.html Armando Manzanero https://stackoverflow.com/questions/23305739/getting-the-href-attribute-and-text-of-certain-kind-of-links/musica-Merengue-de-Banda_Cuisillos.html Banda Cuisillos Я пытался максимально использовать тот факт, что у трех первых есть […]

Извлечение fragmentа текста из тела HTML (в .NET)

У меня есть HTML-контент, который вводится пользователем через редактор richtehttps://stackoverflow.com/questions/1236915/extracting-text-fragment-from-a-html-body-in-net/xt, поэтому он может быть почти любым (менее того, что не должно быть за пределами тега тела, не беспокоится о «head» или doctype и т. Д.). Пример этого содержания: Header 1 Some tehttps://stackoverflow.com/questions/1236915/extracting-text-fragment-from-a-html-body-in-net/xt hereSome more tehttps://stackoverflow.com/questions/1236915/extracting-text-fragment-from-a-html-body-in-net/xt here A link here Header 2 Some tehttps://stackoverflow.com/questions/1236915/extracting-text-fragment-from-a-html-body-in-net/xt hereSome more […]

Каковы самые длинные и кратчайшие имена символов HTML?

Вокруг трубок насчитывается миллион чит-таблиц, которые перечисляют на разные уровни понимания объекты символов, определенные различными версиями и спецификациями HTML. Я не хочу доверять какой-либо одной из них, поэтому я полагаю, что я брошу ее сюда и посмотрю, будет ли кто-нибудь более авторитетным. Итак, допустим, что я хочу сопоставлять любые и все ссылки на символы и […]

Ошибка перезаписи Engine .htaccess MIME

У меня есть сценарий, который выполняет поиск, и я хочу, чтобы результаты также были доступны с запросом mysite.com/searchfor/”myword” Я добавил следующие строки в .htaccess: RewriteEngine on RewriteRule ^/?searchfor/(.*)$ search.php?search=$1 [L] Он работает (страница загружается), но каждый связанный ресурс (css / js) не смог загрузить следующую ошибку: Resource interpreted as Stylesheet but transferred with MIME type […]

Как анализировать атрибуты узла HTML

Я использую C # и должен анализировать HTML-код для чтения атрибутов в парах значений ключа. например, с учетом следующего fragmentа HTML Обратите внимание, что атрибуты могут быть 1. key = “value” пары, например class=”someclass” 2. key = пары значений, например id=my_ID (без кавычек для значений) 3. простые атрибуты, например myAttribute , который не имеет значения […]

regex для извлечения значения атрибута HTML

У меня есть следующий HTML-код TO ://number И мне нужно создать регулярное выражение, которое извлекает значение «114», которое является значением атрибута «значение». Любая помощь, пожалуйста?