Новите планове на Google да пребори спама

Публикувано от на 22 януари 2011 в Техника и джаджи - 0 коментара


Вчера от Google потвърдиха, че спамът в Интернет се е покачил през изминалите месеци и че компанията е определила основните стъпки във борбата си със спама и „фермите за съдържание“.

Шефът на отдел „Качество на търсене“ и настоящ изпълнителен директор Мат Кътс публикува обширна статия в блога на Google за желанието и усилията, които полага компанията да подобри качеството на резултатите при търсене. Той започва, признавайки това, което подозирахме през последните месеци: вече има много спамери, които се опитват да заблудят нищо неподозиращият потребител на Google.

Днес, спамът на английски в резултатите на търсачката, са по малко от половината на това което бяха преди 5 години, а спамът на останалите езици е дори по-нисък. И все пак, ние забелязахме покачване на спама през последните месеци, и въпреки че вече има прогрес в тази посока, полагаме големи грижи за да продължим да подобряваме качеството на търсене.

Кътс пояснява, че уеб-спамът е когато даден сайт се опитва да заблуди Google и да се покачи в позициите си при търсене за определени думи и фрази. С пускането на новата версия на търсачката Google Coffeine, се индексират повече материали, включително и спам.

Докато подобрявахме услугата, увеличавайки размерите и уникалността на търсачката, индексирахме много материали, но разбира се индексирахме и малко спам. За да отговорим на поредното предизвикателство, наскоро пуснахме модифициран „document-level classifier“ (класификатор на нивото на документ), който прави по-трудно класирането на спам документи и съдържание на предни позиции.

Класификаторът на Google е направен така така, че да засича спам в индивидуални уеб страници, като идентифицира спам думи и фрази. Кътс добавя още, че компанията е подобрила и засичането на хакнати страници и че в момента изпробват нови промени, като например наказания за сайтове които копират чуждо съдържание, без да имат тяхно такова (агрегатори – сайтове които автоматично копират съдържанието на други сайтове и публикуват десетки дори стотици статии на ден)

В същото време Google добавя нови алгоритми, за да попречи на „фермите за съдържание“ да се класират добре. Фермите за съдържание, са противоречиви организации, чиято поддръжка не изисква кой знае колко, използват нископлатена работна ръка, която пише статии със съмнително съдържание. Една от най-големите такива е Demand Media.

Тези новини са разбира се лоши за спамерите, но до колко могат да повлияят на Demand Media, чието пускане на акции на борсата е съвсем скоро. Със сигурност Google няма да позволи нищо да застане между тях и качеството на предлаганата услуга, дори и това да означава някои малки компании да „изгорят“

Вчера от Google потвърдиха, че спамът в Интернет се е покачил през изминалите месеци и че компанията е определила основните стъпки във борбата си със спама и „фермите за съдържание“.

Шефът на отдел „Качесто на търсене“ и настоящ изпълнителен директор Мат Кътс публикува обширна статия в блога на Google за желанието и усилията, които полага компанията да подобри качеството на резултатите при търсене. Той започва, признавайки това, което подозирахме през последните месеци: вече има много спамери, които се опитват да заблудят нищо неподозиращият потребител на Google.

„Днес, спамът на английски в резултатите на търсачката, са по малко от половината на това което бяха преди 5 години, а спамът на останалите езици е дори по-нисък. И все пак, ние забелязахме покачване на спама през последните месеци, и въпреки че вече има прогрес в тази посока, полагаме големи грижи за да продължим да подобряваме качеството на търсене.“

Кътс пояснява, че уеб-спамът е когато даден сайт се опитва да заблуди Google и да се покачи в позициите си при търсене за определени думи и фрази. С пускането на новата версия на търсачката Google Coffeine, се индексират повече материали, включитело и спам.

„Докато подобрявахме услугата, увеличавайки размерите и уникалноста на търсачката, индексирахме много материали, но разбира се индексирахме и малко спам. За да отговорим на поредното пердизвикателство, наскоро пуснахме модифициран „document-level classifier“ (класификатор на нивото на документ), който прави по-трудно класирането на спам документи и съдържание на предни позиции.:

Класификаторът на Google е направен така така, че да засича спам в индивидуални уеб страници, като идентифицира спам думи и фрази. Кътс добавя още, че команията е подобрила и засичането на хакнати страници и че в момента изпробват нови промени, като например наказания за сайтове които копират чуждо съдържание, без да имат тяхно такова (агрегатори – сайтове които автоматично копират съдържанието на други сайтове и публикуват десетки дори стотици статии на ден)

В същото време Google добавя нови алгоритми, за да попречи на „фермите за съдържание“ да се класират добре. Фермите за съдържание, са противоречиви организации, чиято поддръжка не изисква кой знае колко, използват нископлатена работна ръка, която пише статии със съмнително съдържание. Една от най-големите такива е Demand Media.

Тези новини са разбира се лоши за спамерите, но до колко могат да повлияят на Demand Media, чието пускане на акции на борсата е съвсем скоро. Със сигурност Google няма да позволи нищо да застане между тях и качеството на предлаганата услуга, дори и това да означава някои малки компании да „изгорят“

222

Публикувай коментар

111