Website sitemap là gì chính là câu hỏi thường được đặt ra bởi những người mới làm SEO. Đây là một bước vô cùng quan trọng và không thể thiếu trong các bước tối ưu hóa Technical SEO trên mọi trang web.
Hãy cùng hungmanh.digital tìm hiểu trong bài viết dưới đây để hiểu rõ hơn sitemap là gì? Và các cách tạo sitemap cho website giúp tối ưu SEO dễ dàng và nhanh chóng.
Mục lục
- 1 Sitemap là gì
- 2 Tầm quan trọng của sitemap
- 3 Những dạng sitemap thường gặp
- 4 Những trang bắt buộc cần XML sitemap
- 5 Cách tạo sitemap cho website đơn giản và dễ dàng
- 6 Checklist tối ưu website sitemap hỗ trợ SEO dễ dàng
- 6.1 Tạo sitemap tự động bằng plugin
- 6.2 Khai báo sitemap tới Google thông qua Search Console
- 6.3 Ưu tiên site có chất lượng tốt trong tệp sitemap của bạn
- 6.4 Xử lý các vấn đề liên quan đến index sitemap
- 6.5 Tạo sitemap có chứa phiên bản canonical
- 6.6 Ưu tiên sử dụng Robots Meta thay cho Robots.txt
- 6.7 Nói không với các URL “noindex” trong sitemap
- 6.8 Sử dụng các tool tự động tạo XML sitemap cho những domain chứa nhiều thông tin
- 6.9 XML sitemap website là gì và RSS/Atom Feeds
- 6.10 Chỉ cập nhật khi có những thay đổi lớn, cực kì quan trọng
- 6.11 Không đặt nặng Priority – Ưu tiên trong sitemap website là gì
- 6.12 Tối ưu file sitemap có dung lượng nhẹ nhất có thể
- 6.13 Sử dụng nhiều sitemap thay vì 1 nếu website có nhiều hơn 50.000 URL
- 7 Tổng kết về Sitemap là gì? Cách tạo sitemap cho website tối ưu SEO nhanh chóng và dễ dàng
- 8 Mạnh Hùng Blog – Blog số và hơn thế nữa
Sitemap là gì
Sitemap – Sơ đồ trang web là một file tài liệu chưa đựng các thông tin về trang, bài viết và các thông tin khác trên một website. Với sơ đồ trang web, các bộ máy tìm kiếm có thể dễ dàng tìm kiếm, crawl, thu thập dữ liệu và nhanh chóng lập chỉ mục các nội dung có trên trang web được khai báo.
Sitemap còn đóng một vai trò quan trọng khi giúp cho bot của công cụ tìm kiếm xác định được các thành phần quan trọng trên trang web và hiển thị các kết quả thông minh và thân thiện hơn khi được truy vấn.
Tầm quan trọng của sitemap
Hiện tại có rất nhiều công cụ tìm kiếm. Có thể kể tới một vài gã khổng lỗ như Google, Bing, Yahoo, Yandex và tương lai gần là Apple. Các công cụ tìm kiếm này đều sử dụng sitemap để có thể thu thập dữ liệu các trang và nội dung xuất hiện trên website. Chính vì thế, không thể phủ nhận được tầm quan trọng của sitemap đối với SEO.
Website có thể hoàn toàn không cần tới sitemap để có thể hoạt động. Tuy nhiên, việc sở hữu sitemap website chuẩn và đúng cách sẽ giúp các con bọ của công cụ tìm kiếm khám phá gần như toàn bộ các trang có trên website.
Nhìn chung, sitemap thực sự hữu ích. Có thể kể tới ví dụ sau đây.
Google thường cho bot tìm các trang con thông qua các đường liên kết được khai báo. Với các trang lâu năm và có hệ thống sức mạnh lớn, việc này diễn ra nhanh chóng và thuận tiện. Nhưng ở trường hợp ngược lại, website mới và không có backlinks, sitemap sẽ là yếu tố góp phần vô cùng lớn vào việc lập chỉ mục các trang của bạn lên kết quả tìm kiếm.
Có thể thấy, sitemap không có tác hại nào đối với website mà còn đem lại tác dụng vô cùng to lớn. Quá trình tạo sitemap không mất quá nhiều thời gian và hoàn toàn miễn phí. Chẳng có lí do gì để không sử dụng sitemap phải không?
Những dạng sitemap thường gặp
Có 2 cách phân biệt các loại sitemap, được phân loại theo cấu trúc và định dạng sitemap
Phân loại theo cấu trúc
Theo kiểu phân loại này, sitemap chia thành 2 dạng
XML sitemap
Định dạng này được tạo ra để dẫn đường cho các bot có thể dễ dàng crawl và lập chỉ mục nhanh chóng.
HTML sitemap
Định dạng sitemap website này tạo ra để đem lại trải nghiệm tìm kiếm dễ dàng, thuận tiện truy vấn các tài nguyên có trên website. Với file sitemap HTML, bạn có thể khéo léo tối ưu trải nghiệm người dùng để đem lại thứ hạng tốt nhất trên công cụ tìm kiếm.
Vậy câu hỏi đặt ra là nên sử dụng dạng sitemap nào?
Về cơ bản, SEO là việc dung hòa giữa các yếu tố kể trên, hungmanh.digital khuyên bạn nên tối ưu và sử dụng cả 2 dạng sitemap để đạt được kết quả tốt nhất.
Phân loại theo định dạng
Có nhiều dạng sitemap được phân loại theo định dạng như:sitemap index, product, category, articles, tag, faq,… tuy nhiên, phổ biến và thường thấy nhất vẫn là 4 dạng sau đây
Image sitemap
Dạng sitemap này chứa đựng những thông tin và dữ liệu của hình ảnh trên website của bạn. Sitemap này được tối ưu để đem lại những kết quả truy vấn khi tìm kiếm hình ảnh trên Google.
News sitemap
Dạng sitemap website này chưa các nội dung kiểm soát khi gửi thông tin tới Google News. Nhờ đó mà các thông tin được tìm kiếm nhanh chóng hơn khi Google News cố gắng crawl trên website của bạn.
Mobile sitemap
Về cơ bản, sitemap mobile không đem lại hiệu suất tốt hơn trong các bài kiểm tra của Mobile Friendly. Tuy nhiên, nếu website của bạn chứa các trang hiển thị trên thiết bị di động thì đây là một dạng được khuyến khích sử dụng.
Video sitemap
Cũng giống như sitemap website hình ảnh, sitemap video chứa những dữ liệu và thông tin liên quan đến các nội dung video có trên trang web của bạn. Google cần dạng này để có những trường dữ liệu mà bot không thể tự thu thập, nhờ đó mang lại những phản hồi chính xác khi người dùng truy vấn.
Những trang bắt buộc cần XML sitemap
Trả lời câu hỏi đơn giản dưới đây, bạn sẽ có câu trả lời
Khi người dùng truy vấn trên công cụ tìm kiếm, những trang nào bạn muốn chúng xuất hiện?
Đó là những trang nên có trong XML sitemap. Ngược lại, với một mẹo nhỏ khi bạn không muốn 1 URL cụ thể xuất hiện. Hãy sử dụng các rel “noindex, follow” để ngăn bot Google thu thập và lập chỉ mục đối với URL đó.
Một vài tài liệu Google đưa ra cho biết. XML sitemap đem lại hiệu quả với hầu hết trang web. Tuy nhiên có lợi cực kì lớn với những trang web:
- Có dung lượng lớn hoặc vô cùng lớn
- Số lượng URL nhiều
- Hệ thống backlinks còn hạn chế
- Có hệ thống đa phương tiện phong phú
Có thể kết luận rằng, tất cả trang web đều cần có sitemap để có thể dễ dàng được lập chỉ mục và hiển thị trên công cụ tìm kiếm. Nhờ đó mà Google có thể có những thông tin cần thiết và thời gian cập nhật lần cuối là khi nào.
Cách tạo sitemap cho website đơn giản và dễ dàng
Hiện tại có nhiều nền tảng website. Phổ biến nhất là 2 dạng WordPress và website không sử dụng WordPress.
Cách tạo sitemap cho website sử dụng nền tảng WordPress
Bước 1: Truy cập trang quản trị WordPress tại địa chỉ example.com/wp-admin/
Bước 2: Cài đặt 1 trong các plugin như Yoast SEO, RankMath hoặc Google XML Sitemap. Ở đây hungmanh.digital hướng dẫn với plugin Yoast SEO.
Bước 3: Tại phần Setting của Yoast SEO, tìm kiếm tới mục Content Types tại menu phía bên trái, click vào Search Appearance
Trong các tab Content Type, Taxonomies hoặc Archives Tabs. Mỗi tab sẽ có một phần điều khiển cho phép bạn tùy biến và tối ưu hóa nội dung muốn gửi tới công cụ tìm kiếm.
Ở đây sẽ cho phép bạn chuyển đổi, thêm, xóa một thành phần khỏi XML sitemap. Hãy lựa chọn bật hoặc tắt các thành phần theo ý muốn của bạn.
Bước 4: Tại các tab Taxonomies và Archives, bạn có thể cho hiển thị Tag và Categories. Sau đó tối ưu hóa các đơn vị phân loại.
Bước 5: Tùy chỉnh sitemap, sau đó click XML Sitemap Index để mở tab mới. Hãy kiểm duyệt và bỏ chọn các trang kém giá trị trong sitemap trước khi gửi đi. Trên nền tảng WordPress thường xuất hiện các trang “rác” như hello world, testing,…
Loại trừ các trang này bằng cách click vào Edit Page ở đầu trang.
Trong trình chỉnh sửa, kéo xuống dưới vào phần Metabox Yoast SEO. Chọn biểu tượng bánh răng cài đặt. Sau đó chuyển “Allow search engines to show this Page in search results?” thành “No”.
Nếu bạn không muốn các trình thu thập dữ liệu liên kết trực tiếp đến trang. Hãy chuyển “Should search engines follow links on this Page?” đặt thành “Yes”.
Cuối cùng click Update để lưu lại các cài đặt. Lặp lại các bước ở phần này để loại trừ từng trang bạn không muốn xuất hiện trong sitemap.
Cách tạo sitemap cho website không sử dụng nền tảng WordPress
Một công cụ online với tên XML-Sitemaps.com cho phép bạn tạo sitemap để áp dụng cho website của mình.
Các bước thực hiện như sau:
Bước 1: Truy cập http://www.xml-sitemaps.com/
Bước 2: Nhập thông tin cho các trường cần thiết
Có thể kể tới các trường như sau:
- Starting URL: Gõ địa chỉ website của bạn vào
- Change Frequency: Nên chọn là daily (bạn có thể chọn thông số phù hợp)
- Last Modification: Nên chọn Use Server’s Response
- Priority: Nên để tự động (Automatically Calculated Priority)
Hoàn tất nhập thông tin, hãy nhấp chọn Start. Hệ thống sau khi hoàn tất sẽ trả về 1 danh sách các tệp sitemap. Hãy quan tâm tới các tệp sitemap.xml, ror.xml, sitemap.html và urllist.txt
Bước 3: Tải xuống file ở định dạng XML
Chỉnh sửa các thông số Priority- Ưu tiên bằng công cụ notepad theo mong muốn.
Bước 4: Truy cập hosting để upload file XML sitemap vừa chỉnh sửa.
Bước 5: Truy cập Google Search Console, sau đó gửi sitemap tại phần Sơ đồ trang web
Checklist tối ưu website sitemap hỗ trợ SEO dễ dàng
Với danh sách dưới đây, hungmanh.digital tin rằng sitemap của bạn sẽ góp phần thúc đẩy SEO hiệu quả nhất. Bởi sitemap website không những đem những thông tin tới cho công cụ tìm kiếm mà còn đem lại những giá trị tuyệt vời trên trang web của bạn. Cùng tìm hiểu các bước tối ưu dưới đây.
Tạo sitemap tự động bằng plugin
Sitemap hiện tại đã có thể được tạo nhanh chóng và dễ dàng bởi nhiều công cụ hỗ trợ như đã nói ở phần trên. Các plugin có thể kể tới như Yoast SEO, RankMath, XML sitemaps hay công cụ tạo sitemap online.
Ngoài ra, việc tạo sitemap bằng cách thủ công cũng không phải khó khi có thể làm theo cấu trúc. Bạn hoàn toàn có thể sử dụng định dạng văn bản bình thường để tạo file và phân chia theo URL trên từng dòng.
Với những người có chuyên môn sâu, họ có thể tạo ra các file sitemap website với các thuộc tính hreflang. Bạn có thể không cần hiểu quá sâu về thuộc tính này. Do đó, hãy ưu tiên sử dụng các plugin tạo sitemap website tự động để hạn chế lỗi và tiết kiệm thời gian nhất.
Khai báo sitemap tới Google thông qua Search Console
Tương tự với việc index URL, sitemap cũng hoàn toàn có thể khai báo với Google thông qua Google Search Console (tên cũ là Webmaster Tool).
Bạn có thể truy cập GSC và gửi đường dẫn sitemap tại mục sơ đồ trang web.
Đừng quên test kiêm tra sitemap của bạn trước khi submit để tránh các lỗi không mong muốn.
Google cho biết rằng không phải toàn bộ các URL có trong sitemap website đều sẽ được index.
Những lợi ích của việc submit sitemap mang lại đó là:
- Giúp Google có thể nắm rõ cấu trúc trang web của bạn
- Phát hiện lỗi, đảm bảo các URL được lập chỉ mục chính xác, đúng cách. Đẩy nhanh tiến độ index mà bớt phụ thuộc vào backlinks.
Ưu tiên site có chất lượng tốt trong tệp sitemap của bạn
Một yếu tố quan trọng trong SEO có thể bạn đã biết là chất lượng trang web. Các yếu tố này ảnh hưởng trực tiếp tới thứ hạng website trên Google. Bạn thử nghĩ rằng, một sitemap website gửi đi mà chứa quá nhiều URL kém chất lượng. Điều này đồng nghĩa với việc rằng Google hiểu website bạn chất lượng không cao.
Do đó, hãy cố gắng ưu tiên các site chất lượng cao mà bạn muốn bot hướng đến, thu thập dữ liệu. Đây có thể là các trang quan trọng trong website. Đặc điểm nhận biết các site này có thể kể đến như:
- Tối ưu hóa thân thiện với công cụ tìm kiếm
- Chứa video, hình ảnh, media
- Nội dung rõ ràng, rành mạch, chuyên biệt
- Được tham gia bởi người dùng như review, rate,…
Xử lý các vấn đề liên quan đến index sitemap
Mình đã nhắc bên trên, không phải tất cả các site được gửi thông qua sitemap sẽ được lập chỉ mục.
Nhiều nhà quản lý đã chia nhỏ các thành phần không được lập chỉ mục để thử nghiệm. Cho đến phiên bản hiện tại. Google Search Console đã thông báo các vấn đề để bạn khắc phục thông qua “Các vấn đề lập chỉ mục”. Hãy khắc phục các vấn đề này để đảm bảo hiệu suất index cao nhất.
Tạo sitemap có chứa phiên bản canonical
Đa số trên website sẽ có các trang có hình thức hoặc nội dung giống nhau. Ví dụ như các biến thể của 1 sản phẩm, chỉ khác nhau về size. Do đó, hãy sử dụng thẻ canonical để thông báo cho Google biết rằng trang nào sẽ là phiên bản chính.
Cũng như các site bình thường. Thẻ canonical xuất hiện trong sitemap website sẽ giúp cho bot thu thập dữ liệu và index hiệu quả hơn.
Ưu tiên sử dụng Robots Meta thay cho Robots.txt
Muốn loại một trang khỏi lập chỉ mục trên Google, hãy sử dụng các tag “noindex, follow”. Các tag này được định nghĩa là Robots Meta.
Việc đặt các thẻ tag Robots Meta này giúp URL không được cào dữ liệu và lập chỉ mục. Tuy nhiên, sức mạnh và các giá trị sẽ được bảo toàn. Nên áp dụng các tag này cho các trang quan trọng nhưng không nên xuất hiện trên trang kết quả tìm kiếm.
Ngược lại, với robots.txt khi các site đó muốn chặn hẳn và áp dụng với các trang không quan trọng.
Nói không với các URL “noindex” trong sitemap
Sitemap như một bản đồ dẫn đường cho bot. Do đó, đã không muốn thu thập dữ liệu thì đừng đưa chúng vào sitemap mặc dù đã chặn noindex.
Lý giải cho điều này, Google cho biết đây sẽ làm cho bot hiểu nhầm website thiếu tính nhất quán, dẫn tới các ảnh hưởng không mong muốn trong quá trình lập chỉ mục.
Hãy chỉ đưa các trang cần thiết và muốn được lập chỉ mục vào sitemap.
Sử dụng các tool tự động tạo XML sitemap cho những domain chứa nhiều thông tin
Với những trang vừa và nhỏ, việc quản lý từng URL đã vô cùng khó khăn. Điều đó càng không thể với những domain có số lượng URL đồ sộ. Hãy ưu tiên thiết lập các quy tắc để đưa những URL vào sitemap. Ví dụ như khi thay đổi từ tag “noindex” qua “index, follow”.
Hiện tại có rất nhiều tool hoặc plugin hỗ trợ việc này.
XML sitemap website là gì và RSS/Atom Feeds
Đây là một dạng XML, có thể hiểu rằng công dụng chính là tóm tắt thông tin.
RSS có nhiệm vụ ping cho các công cụ tìm kiếm mỗi khi trang của bạn có sự thay đổi hoặc cập nhật. Hiểu đơn giản, khi bạn thay đổi một nội dung hoặc xuất bản nội dung mới, Google hoặc các công cụ tìm kiếm sẽ nhanh chóng có được thông tin của bạn.
Điều này sẽ đem lại việc tìm kiếm nội dung mới nhanh chóng cho cả công cụ tìm kiếm hoặc người dùng.
Chỉ cập nhật khi có những thay đổi lớn, cực kì quan trọng
Các Bot hoạt động dựa trên hoạt động của người dùng. Và chúng đủ thông minh để biết khi nào trang của bạn cần thu thập dữ liệu lại. Do đó, đừng cố lừa chúng lập chỉ mục lại bằng việc spam sitemap.
Bạn có thể nhận nhiều án phạt từ Google như xóa hoàn toàn ngày đăng tải nếu họ không phát hiện được nội dung cập nhật mới nào trong khi bạn ping cập nhật liên tục. Hãy chỉ cập nhật thời gian sửa đổi nếu thật sự có những thay đổi rõ rệt trên trang của bạn.
Không đặt nặng Priority – Ưu tiên trong sitemap website là gì
Một số trình tạo sitemap có xuất hiện cột Priority. Khi đọc cột này, bots hiểu rằng các trang đó cần được ưu tiên và có tính quan trọng cao. Qua thời gian, một số technical cho rằng tính năng này đã bị Google bỏ qua.
Tối ưu file sitemap có dung lượng nhẹ nhất có thể
Dù là gì, thì dung lượng càng nhỏ, máy chủ càng bớt áp lực. Dung lượng file sitemap website tối đa đã được cập nhật lên tới 50MB vào năm 2016. Tuy nhiên, việc giữ dung lượng sitemap nhẹ nhàng nhất có thể luôn được khuyến khích.
Sử dụng nhiều sitemap thay vì 1 nếu website có nhiều hơn 50.000 URL
50.000 URL là con số tối đa mà 1 file sitemap có thể lưu trữ
Đa số các website đang hoạt động tại Việt Nam đều không sử dụng hết con số này. Tuy nhiên với những trang có nhiều hơn thì cũng đừng quá lo lắng. Các công cụ tìm kiếm cho phép bạn gửi nhiều file sitemap khác nhau đồng thời. Hãy tận dụng chúng.
Tổng kết về Sitemap là gì? Cách tạo sitemap cho website tối ưu SEO nhanh chóng và dễ dàng
Như vậy qua bài viết trên đây, chúng ta đã cùng nhau tìm hiểu về website sitemap. Bạn đã hiểu sitemaps là gì và cách tạo sitemap cho website như thế nào rồi đúng không. Đừng quên để lại một góp ý phía bên dưới để cùng thảo luận về sitemap website là gì hay technical SEO cùng hungmanh.digital nhé.
Mạnh Hùng Blog – Blog số và hơn thế nữa
Facebook: Nguyễn Mạnh Hùng
Zalo: Nguyễn Mạnh Hùng
Instagram: @hungmanh.digital
Hữu ích, cảm ơn admin đã chia sẻ!
Cảm ơn anh. POD Media rất vui vì thông tin này hữu ích với anh.