Puncte:1

De ce google trimite spam site-ului meu Wordpress cu cuvinte cheie pentru întâlniri?

drapel br

Am un site Wordpress care este lovit cu peste 100.000 de solicitări pe zi cu aceeași solicitare de mai jos. Toate aceste GET-uri provin de la aproximativ 200 de IP-uri diferite din același interval de rețea Google (66.249.x.x). Nu este /căutare/ ruta pe site, dar ceva în Wordpress (Relevanssi?) trebuie să proceseze această solicitare deoarece există erori de colare UTF-8 în DB, probabil din cauza emoji-urilor sau a caracterelor chirilice:

Eroare baza de date WordPress Combinație ilegală de colaționări (utf8_general_ci,IMPLICIT) și (utf8mb4_unicode_ci,COERCIBLE) pentru operațiunea „like” pentru interogarea \n\t\t\tSELECT NUMĂRARE(DIstinct(relevanssi.doc))\n\t\t\t\tDIN 49qi0c_relevanssi AS relevanssi\n\t\t\t\t UNDE (relevanssi.term LIKE „berbat\xf0\x9f\xaa\x80\xe2\x9d\xa4\xef\xb8\x8f\xef\xb8\x8fwww%” SAU relevanssi.term_reverse LIKE CONCAT(REVERSE('berbat\xf0\x9f\xaa\x80\xe2\x9d\xa4\xef\xb8\x8f\xef\xb8\x8fwww'), '%')) realizat de require('wp-blog-header.php'), wp, WP->main, WP->query_posts, WP_Query->query, WP_Query->get_posts, apply_filters_ref_array('posts_pre_query'), WP_Hook->apply_filters, relevanssi_query, relevanssi_do_query, relevanssi_search, relevanssi_search, relevanssi_generate_df_counts, QM_DB->interogare

Am verificat forumul Relevanssi și am găsit pe cineva care a postat aproape aceeași problemă.S-a spus că este „inofensiv” și nu părea să preocupe pe nimeni, așa că firul a fost închis. Totuși, sarcina mare a acestor solicitări începe să întârzie site-ul, iar erorile generate umple jurnalele de sub /var/ compartimentare. Am /19 de la Google blocat chiar acum, dar probabil că nu este răspunsul corect, deoarece este Google (clasare a paginii și toate astea). A mai văzut cineva astfel de lucruri de la Google?

OBȚINE /search/%F0%9F%AA%80BEST+DATING+SITE%E2%9D%A4%EF%B8%8F%EF%B8%8F%C4%B0ngiliz+kad%C4%B1n+i%C3%A7+% C3%A7ama%C5%9F%C4%B1r%C4%B1+gal+r%C3%B6ntgenci+%C3%B6n%C3%BCnde+berbat%F0%9F%AA%80%E2%9D%A4%EF% B8%8F%EF%B8%8FWww.MtSp.XyZ%F0%9F%AA%80%E2%9D%A4%EF%B8%8F%EF%B8%8F%C4%B0ngiliz+kad%C4%B1n+ i%C3%A7+%C3%A7ama%C5%9F%C4%B1r%C4%B1+gal+r%C3%B6ntgenci+%C3%B6n%C3%BCnde+berbat+%C4%B0ngiliz+kad%C4%B1n+ i%C3%A7+%C3%A7ama%C5%9F%C4%B1r%C4%B1+gal+r%C3%B6ntgenci+%C3%B6n%C3%BCnde+berbat+%C4%B0ngiliz+kad%C4%B1n+ i%C3%A7+%C3%A7ama%C5%9F%C4%B1r%C4%B1+gal+r%C3%B6ntgenci+%C3%B6n%C3%BCnde+berbat/feed/rss2/?page_number_9=1&page_number_15=7&page_number_14 =3&page_number_16=3&page_number_10=1&page_number_12=33&page_number_17=3&page_number_13=3&page_number_11=17 HTTP/1.1" 200 718084 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X) Build/MMB29P) AppleWebKit/537.36 (KHTML, ca Gecko) Chrome/97.0.4692.71 Mobile Safari/537.36 (compatibil; Googlebot/2.1; +http://www.google.com/bot.html)

drapel vn
Puteți oferi un exemplu de IP real al unuia dintre acestea? Acesta arată practic ca spam de referință (unele site-uri arată „căutări de top/recente” într-o bară laterală); ar putea fi doar un server compromis în platforma cloud a Google, nu GoogleBot propriu-zis. Verificați-l la https://developers.google.com/search/docs/advanced/crawling/verifying-googlebot.
Nstevens avatar
drapel br
Sigur, un IP a fost 66.249.70.19. Este în intervalul #21 aici: https://www.gstatic.com/ipranges/goog.json. Cred că au fost câteva IP-uri nu în acel netblock, dar majoritatea erau. Voi verifica informațiile pe care le-ați postat. Mulțumiri!
drapel vn
Interesant; se urmărește înapoi la GoogleBot. Mă întreb dacă cineva abuzează de „crawlere ca GoogleBot” din Google Search Console sau creează o pagină care indică aceste adrese URL de căutare pe care Google le accesează cu crawlere și le presupune că este de bună-credință.
Nstevens avatar
drapel br
Nu sunt sigur care este această caracteristică, dar o voi rula de administratorul nostru WP. Era îngrijorat că ceva cu pluginul său SEO îi poate spune lui Google să acceseze cu crawlere site-ul pentru acei termeni. Am avut o altă sugestie, acestea ar putea fi gazde Google App Engine (gazduire VM?). Nu sunt bine versat în serviciile Google, dar mi se pare o posibilă potrivire.
drapel in
Utilizați consola de căutare Google, s-ar putea să vă spună de ce, sau cel puțin să obțineți indicii după câteva zile.
drapel jp
adăugați `/search/ la `robots.txt`
Nstevens avatar
drapel br
Mi-aș dori să fie atât de ușor. `robots.txt` este pur discreționar. Orice client este liber să-l ignore.
drapel vn
@Nstevens Deși este adevărat, GoogleBot **cu siguranță** îl respectă.
Nstevens avatar
drapel br
Ah, bine. Văd ce spui acum @AlexD. Mulțumiri.

Postează un răspuns

Majoritatea oamenilor nu înțeleg că a pune multe întrebări deblochează învățarea și îmbunătățește legătura interpersonală. În studiile lui Alison, de exemplu, deși oamenii își puteau aminti cu exactitate câte întrebări au fost puse în conversațiile lor, ei nu au intuit legătura dintre întrebări și apreciere. În patru studii, în care participanții au fost implicați în conversații ei înșiși sau au citit transcrieri ale conversațiilor altora, oamenii au avut tendința să nu realizeze că întrebarea ar influența – sau ar fi influențat – nivelul de prietenie dintre conversatori.