Архитектура любого сайта отражает структуру и способ организации внутренних ссылок на ресурсе. Она оказывает существенное влияние на показатели ранжирования сайта в поиске, а также имеет важное значение в навигации по сайту для пользователей и поисковых роботов.
С помощью ссылок поисковые роботы сканируют интернет. Они переходят по внутренним и внешним ссылкам, которые содержатся на странице, а потом приступают к ссылкам на следующих страницах. Таким образом поисковые механизмы находят и индексируют страницы каждого сайта.
Поисковики уровня Google считают каждую ссылку признаком важности страницы и воспринимают количество ссылок как показатель для ранжирования запросов в поиске.
Все это означает, что внутренняя перелинковка важна для сканирования, понимания и ранжирования сайта поисковыми механизмами. Пол Шапиро создал метрику «внутренний PageRank», с помощью которой можно идентифицировать страницу, которая будет восприниматься поисковой системой как приоритетная.
Можно выделить следующие виды внутренних ссылок.
Для того, чтобы создать верную внутреннюю перелинковку, необходимо правильно организовать общие навигационные элементы. При этом надо следовать правильной структуре сайта. В этой ситуации лучше всего создавать классическую внутреннюю перелинковку и использовать силос-архитектуру Брюса Клэя в качестве основы для внутренних ссылок.
После того, как на вашем сайте создан надежный фундамент для внутренних ссылок, можно изучить навигационные ссылки и ссылки из контента, которые влияют на работу поисковых механизмов, сканирующих и ранжирующих страницы сайта.
PageRank – это специальный алгоритм Google, применяемый для ранжирования страниц по результатам запросов. Этот алгоритм подсчитывает количество и качество ссылок, которые ведут на страницу. И на основании этого определяет степень важности сайта.
Google определяет PageRank страницы в индексе, и таким образом связывает между собой различные страница одного сайта и страницы других сайтов, которые содержат ссылки на них.
Но смысл PageRank состоит в том, чтобы определить степень важности страницы исходя из количества и качества ссылок с других страниц. Эта система работает на всех страницах интернета и на конкретных подмножествах.
Для того, чтобы определить ценность каждой страницы одного сайта, можно использовать систему PageRank для внутренних ссылок. Для того, чтобы определить «внутренний PageRank», нужно выполнить следующее:
1 | library(«igraph») |
2 | # Swap out path to your Screaming Frog All Outlink CSV. For Windows, remember to change backslashes to forward slashes. |
3 | links <- read.csv(«C:/Documents/screaming-frog-all-outlinks.csv», skip = 1) # CSV Path |
4 | # This line of code is optional. It filters out JavaScript, CSS, and Images. Technically you should keep them in there. |
5 | links <- subset(links, Type==»HREF») # Optional line. Filter. |
6 | links <- subset(links, Follow==»true») |
7 | links <- subset(links, select=c(Source,Destination)) |
8 | g <- graph.data.frame(links) |
9 | pr <- page.rank(g, algo = «prpack», vids = V(g), directed = TRUE, damping = 0.85) |
10 | values <- data.frame(pr$vector) |
11 | values$names <- rownames(values) |
12 | row.names(values) <- NULL |
13 | values <- values[c(2,1)] |
14 | names(values)[1] <- «url» |
15 | names(values)[2] <- «pr» |
16 | # Swap out ‘domain’ and ‘com’ to represent your website address. |
17 | values <- values[grepl(«https?:\\/\\/(.*\\.)?domain\\.com.*», values$url),] # Domain filter. |
18 | # Replace with your desired filename for the output file. |
19 | write.csv(values, file = «output-pagerank.csv») # Output file. |
Используя этот код, важно правильно указать путь к CSV-файлу Screaming Frog, свой домен и TDL-расширение, а также создать имя итогового файла, в котором будут находиться показатели внутреннего PageRank всех страниц вашего сайта.
Таким образом, с помощью описанной методики вы сможете строить внутреннюю перелинковку вашего сайта. К проверке внутренних ссылок сайта или сканированию и расчету внутреннего PageRank можно приступать после того, как готова базовая структура навигационных ссылок.