Les googlebots sont des robots d'indexation utilisés par le moteur de recherche Google afin de recenser et indexer les pages web.La chaîne de caractères permettant de les identifier en tant que User-Agent est, selon la tâche qu'ils effectuent, l'une des trois suivantes : Googlebot/2.1 (+http://www.google.com/bot.html) Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) Googlebot-Image/1.0

PropertyValue
dbpedia-owl:abstract
  • Les googlebots sont des robots d'indexation utilisés par le moteur de recherche Google afin de recenser et indexer les pages web.La chaîne de caractères permettant de les identifier en tant que User-Agent est, selon la tâche qu'ils effectuent, l'une des trois suivantes : Googlebot/2.1 (+http://www.google.com/bot.html) Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) Googlebot-Image/1.0
  • Googlebot es el robot de búsqueda usado por Google. Colecciona documentos desde la web para construir una base de datos para el motor de búsqueda Google.Si un webmaster no quiere que su página sea descargada por un Googlebot, puede insertar un texto llamado robots.txt, el cual puede hacer que Googlebot (y otros bots) no investiguen una o varias páginas o incluso todo el sitio web.Googlebot tiene dos versiones, deepbot y freshbot. Deepbot investiga profundamente, tratando de seguir cualquier enlace en esa página, además de poner esta página en el caché, y dejarla disponible para Google. En Marzo del 2006, completaba este proceso en casi un mes.[cita requerida] Freshbot investiga la web buscando contenido nuevo. Visita sitios que cambian frecuentemente. Idealmente, el freshbot visitará la página de un periódico todos los días, mientras que la de una revista cada semana, o cada 15 días. Así, por ejemplo, puede captar noticias que recién hayan ocurrido, sin tener que esperar semanas.Googlebot descubre enlaces a otras páginas, y se dirige hacia ellos también, así puede abarcar toda la web fácilmente.Googlebot es el robot que utiliza Google para 'rastrear' los sitios de Internet. No solamente indexa páginas web (HTML), sino que también extrae información de ficheros PDF, PS, XLS, DOC y algunos otros más.La frecuencia con la que Googlebot accede a un sitio web depende del PageRank de éste. Mientras mayor sea este valor, el robot accederá más asiduamente a sus páginas.Por ejemplo, podemos comprobar que los sitios con PR10 (el valor más alto), como yahoo.com o usatoday.com, han sido 'rastreados' por Googlebot ayer o incluso o hoy mismo, mientras que otros han sido accedidos hace varias semanas. Esto se puede comprobar accediendo al 'cache' de esta página.Para comprobar si Googlebot ha accedido a nuestro sitio web, deberemos echar un vistazo a los logs de nuestro servidor. En ellos, deberemos observar si hay registros de accesos en los que aparezca 'googlebot'. Generalmente aparecerá el nombre del servidor, el cual podrá ser alguno de estos:SERVIDOR DIRECCION IPcrawl1.googlebot.com 216.239.46.20crawl2.googlebot.com 216.239.46.39crawl3.googlebot.com 216.239.46.61crawl4.googlebot.com 216.239.46.82... ...crawl9.googlebot.com 216.239.46.234crawler1.googlebot.com 64.68.86.9crawler2.googlebot.com 64.68.86.55... ...crawler14.googlebot.com 64.68.82.138Una vez que Googlebot haya 'rastreado' nuestra página, seguirá los enlaces que en ella encuentre (los HREF y los SRC).Por lo tanto, si quieres que Googlebot indexe tu página web, solamente es necesario que algún otro sitio tenga un hiperenlace al tuyo. Si no es así, siempre puedes añadir directamente tu URL.
  • Googlebot é o robô indexador usado pelo Google para indexar páginas e documentos da web para construir um índice de buscas para o Google Search...
  • Googlebot – robot internetowy, używany przez Google. Przechodząc z jednej strony na drugą za pomocą odnośników indeksuje je tym samym tworząc indeks dla wyszukiwarki Google.Jeśli webmaster zażyczy sobie, aby informacje na jego stronie nie były dostępne dla Googlebota lub innego robota internetowego, może wykonać to za pomocą pliku robots.txt.Googlebot działa w dwóch wersjach; wykonuje tak zwany deep crawl i fresh crawl. Deep crawl czyli pełzanie głębokie ma za zadanie przechodzenie na każdy link jaki znajdzie na "oglądanych" przez siebie stronach i dodanie tylu, ile może, do indeksu. Ten proces jest kończony i powtarzany mniej więcej co miesiąc. W trybie Fresh crawl surfuje po sieci i odwiedza strony zmieniające się często; w zależności od tego, jak często są aktualizowane. Operacja ta wykonywana jest w celu odświeżenia często zmieniającej się zawartości niektórych stron.Googlebot przegląda strony korzystając ze wszystkich linków, jakie znajdzie na każdej wcześniej odwiedzonej przez siebie stronie. Nowe strony muszą być zalinkowane od innej, znanej już Googlebotowi strony, aby mógł ją odwiedzić i zaindeksować.Problem, z którym często borykają się webmasterzy, to duże zużycie transferu przez Googlebota. Może on powodować, że strony wykorzystają swój limit transferu i zostaną na pewien czas zawieszone. To problem dotyczący szczególnie stron mirrorujących, które przechowują gigabajty danych. Google umożliwia dostęp do "Webmaster Tools", która umożliwia posiadaczom stron dopasowanie "natężenia" odwiedzin Googlebota na stronie.== Przypisy ==
  • グーグルボット(Googlebot)は、Googleが採用しているクローラ(Webロボット)ソフトウェアである。
  • Googlebot è lo spider web (italianizzato in "agente mobile") di Google.Googlebot effettua due tipi di scansione del web: la Deep-crawl (fatta una volta al mese circa) e la Fresh-crawl (quasi tutti i giorni).La prima come detto viene fatta una volta al mese e viene scansionato tutto il web pagina per pagina, aggiornando indici, pagerank e cache.Dopo una Deep-crawl Google impiega circa 6-8 giorni per aggiornare completamente i suoi indici e propagarli in tutti i datacenter. In questo periodo di tempo si parla della cosiddetta "Google dance" perché i risultati che escono possono essere diversi di volta in volta. Dopo qualche giorno invece si stabilizzano.La seconda invece viene fatta quasi tutti i giorni e in pratica aggiorna le pagine che già sono presenti nell'indice e aggiunge quelle eventualmente create dopo l'ultima Deep-crawl.Esistono altri strumenti e procedure che il Googlebot utilizza per indirizzare (e limitare) le sue scansioni. Uno tra i più importanti è il file "robots.txt", che dovrebbe essere sempre presente sui web server attestati su internet, in quanto naturale oggetto di scansione da parte degli spider.
  • Googlebot ist der Webcrawler der Suchmaschine Google. Dabei handelt es sich um ein Computerprogramm, das Texte und Bilder im World Wide Web herunterlädt und diese über die Web- und die Bildsuche von Google auffindbar macht.
dbpedia-owl:wikiPageExternalLink
dbpedia-owl:wikiPageID
  • 568669 (xsd:integer)
dbpedia-owl:wikiPageLength
  • 2611 (xsd:integer)
dbpedia-owl:wikiPageOutDegree
  • 17 (xsd:integer)
dbpedia-owl:wikiPageRevisionID
  • 104240293 (xsd:integer)
dbpedia-owl:wikiPageWikiLink
prop-fr:wikiPageUsesTemplate
dcterms:subject
rdfs:comment
  • Les googlebots sont des robots d'indexation utilisés par le moteur de recherche Google afin de recenser et indexer les pages web.La chaîne de caractères permettant de les identifier en tant que User-Agent est, selon la tâche qu'ils effectuent, l'une des trois suivantes : Googlebot/2.1 (+http://www.google.com/bot.html) Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) Googlebot-Image/1.0
  • Googlebot é o robô indexador usado pelo Google para indexar páginas e documentos da web para construir um índice de buscas para o Google Search...
  • グーグルボット(Googlebot)は、Googleが採用しているクローラ(Webロボット)ソフトウェアである。
  • Googlebot ist der Webcrawler der Suchmaschine Google. Dabei handelt es sich um ein Computerprogramm, das Texte und Bilder im World Wide Web herunterlädt und diese über die Web- und die Bildsuche von Google auffindbar macht.
  • Googlebot — поисковый робот компании Google, используемый для сканирования мировой сети и пополнения поискового индекса системы Google.
  • Googlebot è lo spider web (italianizzato in "agente mobile") di Google.Googlebot effettua due tipi di scansione del web: la Deep-crawl (fatta una volta al mese circa) e la Fresh-crawl (quasi tutti i giorni).La prima come detto viene fatta una volta al mese e viene scansionato tutto il web pagina per pagina, aggiornando indici, pagerank e cache.Dopo una Deep-crawl Google impiega circa 6-8 giorni per aggiornare completamente i suoi indici e propagarli in tutti i datacenter.
  • Googlebot, Google tarafından kullanılan bir arama bot'udur. Bu bot web'deki dökümanları toplar ve Google Arama Motoru için aranabilir bir içerik listesi ( index ) oluşturur. Eğer site yöneticiyseniz ve sitenizin Google aramalarında ya da herhangi bir arama motoru botunun indeksleme işleminde çıkmasını istemiyorsanız sitenizin dizininde bir robots.txt adlı dosya yaratarak ,ya da sadece Googlebot için aşağıdaki meta etiketini kullanarak botların indekslemesini engelleyebilirsiniz.
  • Googlebot – robot internetowy, używany przez Google. Przechodząc z jednej strony na drugą za pomocą odnośników indeksuje je tym samym tworząc indeks dla wyszukiwarki Google.Jeśli webmaster zażyczy sobie, aby informacje na jego stronie nie były dostępne dla Googlebota lub innego robota internetowego, może wykonać to za pomocą pliku robots.txt.Googlebot działa w dwóch wersjach; wykonuje tak zwany deep crawl i fresh crawl.
  • Googlebot je vyhledávací robot softwarové společnosti Google, který indexuje webové stránky, a pak je lze dohledat přes vyhledávač Google. Sběr probíhá z velké řady IP adres a samostatných počítačů, proto je sběr opravdu velmi rychlý a tak si může Google dovolit aktuálnost i pár hodin.Na některé weby není vhodné roboty pouštět z důvodu citlivých údajů, které by se neměly běžně zobrazovat ve výsledcích hledání.
  • Googlebot es el robot de búsqueda usado por Google. Colecciona documentos desde la web para construir una base de datos para el motor de búsqueda Google.Si un webmaster no quiere que su página sea descargada por un Googlebot, puede insertar un texto llamado robots.txt, el cual puede hacer que Googlebot (y otros bots) no investiguen una o varias páginas o incluso todo el sitio web.Googlebot tiene dos versiones, deepbot y freshbot.
rdfs:label
  • Googlebot
  • Googlebot
  • Googlebot
  • Googlebot
  • Googlebot
  • Googlebot
  • Googlebot
  • Googlebot
  • Googlebot
  • Googlebot
  • グーグルボット
owl:sameAs
http://www.w3.org/ns/prov#wasDerivedFrom
foaf:isPrimaryTopicOf
is dbpedia-owl:wikiPageWikiLink of
is foaf:primaryTopic of