Публикации с тэгом "SPSS"
СТАТЬЯ Очищаем веб-страницы от информационного шума
Предыдущие мои статьи были, в основном, о теоретической части Data Mining, сегодня хочу рассказать о практическом примере, который используется в кандидаткой диссертации (в связи с этим данный пример на данном этапе развития нельзя считать полноценным работающим проектом, но прототипом его считать можно). Будем очищать веб-страницы от «информационного шума». Так в чем же проблема? Проблема заключается в том, что добрая половина веб-сайтов содержит кучу ненужной информации на страницах — так назы...
<1>