Как анализировать HTML-tags в Matlab с помощью regexp?

Я слишком коротко, и я хотел бы извлечь строку, как показано ниже. Проблема заключается в том, что тег не имеет формы data .

Данный,

 s =  5,888  

как извлечь всего 5 888 в matlab?

Здесь вы найдете полезную информацию, или здесь , или здесь , все из которых являются результатами первой страницы Google и были бы быстрее, чем задавать вопрос здесь.

В любом случае, быстро-грязный способ: вы можете фильтровать символы <> :

 >> s = ' 5,888   test ' >> a = regexp(s, '[<>]'); >> s( cell2mat(arrayfun(@(x,y)x:y, a(2:2:end-1)+1, a(3:2:end)-1, 'uni',false)) ) ans = 5,888 test 

Или, немного более прочный и намного более чистый, замените все между любыми тегами (включая tags) на пустое:

 >> s = regexprep(s, '< .*?>', '') ans = 5,888 test 

Спасибо людям за вашу помощь. Я в основном пытаюсь получить наseleniumие графства США в Матлабе. Думаю, я поделюсь своим кодом, хотя и не самым элегантным. Может помочь какой-то душе. 🙂

 county = 'morris'; state = 'ks'; county = strrep(county, ' ' , '+'); str = sprintf('https://www.google.com/search?&q=population+%s+%s',county,state); s = urlread(str); pop = regexp(s,']*>(.*?)', 'tokens'); pop = char(pop{:}); pop = strrep(pop, ',' , ''); pop = str2num(pop);