Извлечение данных из веб-ресурсов
пятница, 25 февраля 2011,
Александр Краковецкий
Содержание серии статей под общим названием "Извлечение данных из веб-ресурсов".
- Введение
- 1. Форматы представления данных в вебе
- XML, RDF / OWL / SPARQL, RSS / Atom / OPML. (ASP.NET RSS Toolkit)
- Формат CSV
- Формат JSON
- Формат OData
- 2. Подходы к извлечению данных из веб-ресурсов
- 3. User Agents
- 4. Инструменты для извлечения данных в .NET
- C# WebBrowser - такой простой и такой сложный. Часть 1: HTML Editor
- C# WebBrowser - такой простой и такой сложный. Часть 2: FAQ
- C# WebBrowser - такой простой и такой сложный. Часть 3
- HttpWebRequest / HttpWebResponse, WebClient
- 5. Сторонние библиотеки для извлечения данных
- HtmlAgilityPack
- Использование jQuery для извлечения данных
- 6. Библиотека Data Extracting SDK
- 7. DEL – Data Extraction Language
- 8. Автоматическая обработка веб-документов
Страница будет обновляться по ходу добавления (обновления) материалов.
Компании из статьи
Microsoft Украина | Украинское подразделение компании Microsoft. |