Преобразование HTML в RDF

Я ищу общий API / веб-сервис / инструмент / etc …, который позволяет преобразовать данную HTML-страницу в график RDF как можно более конкретным (скорее всего, используя онтологию обратной костей и / или картографию).

Вы доказали GRDDL ?

GRDDL – это метод получения данных RDF из документов XML и, в частности, страниц XHTML.

Я использовал XQuery для извлечения данных из заданного набора веб-страниц. Мне пришлось писать пользовательские запросы для веб-страниц. Я думаю, что это самый прямой подход, который требуется для определенного набора файлов HTML. Однако это, очевидно, не подходит для общего случая. Для другого набора веб-страниц необходимо написать другие пользовательские запросы.

Я использовал JSoup для очистки данных из HTML. Он использует стиль jQuery для запроса HTML DOM, с которым я уже был знаком, поэтому для меня это был очень простой инструмент. Я также финансирую его довольно устойчиво, но мне нужно было просто очистить 3 источника данных, поэтому у меня еще нет богатого опыта с этим инструментом. jsoup