preload Loading ...

Sitemap là gì? Cách tạo sitemap cho website nhanh chóng

sitemap-la-gi

Website sitemap là gì chính là câu hỏi thường được đặt ra bởi những người mới làm SEO. Đây là một bước vô cùng quan trọng và không thể thiếu trong các bước tối ưu hóa Technical SEO trên mọi trang web.

Hãy cùng hungmanh.digital tìm hiểu trong bài viết dưới đây để hiểu rõ hơn sitemap là gì? Và các cách tạo sitemap cho website giúp tối ưu SEO dễ dàng và nhanh chóng.

Mục lục

Sitemap là gì

Sitemap – Sơ đồ trang web là một file tài liệu chưa đựng các thông tin về trang, bài viết và các thông tin khác trên một website. Với sơ đồ trang web, các bộ máy tìm kiếm có thể dễ dàng tìm kiếm, crawl, thu thập dữ liệu và nhanh chóng lập chỉ mục các nội dung có trên trang web được khai báo.

khai-niem-sitemap
Khái niệm sitemap là gì

Sitemap còn đóng một vai trò quan trọng khi giúp cho bot của công cụ tìm kiếm xác định được các thành phần quan trọng trên trang web và hiển thị các kết quả thông minh và thân thiện hơn khi được truy vấn.

Tầm quan trọng của sitemap

Hiện tại có rất nhiều công cụ tìm kiếm. Có thể kể tới một vài gã khổng lỗ như Google, Bing, Yahoo, Yandex và tương lai gần là Apple. Các công cụ tìm kiếm này đều sử dụng sitemap để có thể thu thập dữ liệu các trang và nội dung xuất hiện trên website. Chính vì thế, không thể phủ nhận được tầm quan trọng của sitemap đối với SEO.

tam-quan-trong-cua-sitemap
Tầm quan trọng của sitemap đối với website

Website có thể hoàn toàn không cần tới sitemap để có thể hoạt động. Tuy nhiên, việc sở hữu sitemap website chuẩn và đúng cách sẽ giúp các con bọ của công cụ tìm kiếm khám phá gần như toàn bộ các trang có trên website.

Nhìn chung, sitemap thực sự hữu ích. Có thể kể tới ví dụ sau đây.

Google thường cho bot tìm các trang con thông qua các đường liên kết được khai báo. Với các trang lâu năm và có hệ thống sức mạnh lớn, việc này diễn ra nhanh chóng và thuận tiện. Nhưng ở trường hợp ngược lại, website mới và không có backlinks, sitemap sẽ là yếu tố góp phần vô cùng lớn vào việc lập chỉ mục các trang của bạn lên kết quả tìm kiếm.

Có thể thấy, sitemap không có tác hại nào đối với website mà còn đem lại tác dụng vô cùng to lớn. Quá trình tạo sitemap không mất quá nhiều thời gian và hoàn toàn miễn phí. Chẳng có lí do gì để không sử dụng sitemap phải không?

Những dạng sitemap thường gặp

Có 2 cách phân biệt các loại sitemap, được phân loại theo cấu trúc và định dạng sitemap

Phân loại theo cấu trúc

Theo kiểu phân loại này, sitemap chia thành 2 dạng

XML sitemap

Định dạng này được tạo ra để dẫn đường cho các bot có thể dễ dàng crawl và lập chỉ mục nhanh chóng.

mot-doan-sitemap-cua-hungmanh.digital-media
Một đoạn sitemap XML của hungmanh.digital

HTML sitemap

Định dạng sitemap website  này tạo ra để đem lại trải nghiệm tìm kiếm dễ dàng, thuận tiện truy vấn các tài nguyên có trên website. Với file sitemap HTML, bạn có thể khéo léo tối ưu trải nghiệm người dùng để đem lại thứ hạng tốt nhất trên công cụ tìm kiếm.

sitemap-html
Ví dụ về sitemap html trên trang chủ Apple

Vậy câu hỏi đặt ra là nên sử dụng dạng sitemap nào?

Về cơ bản, SEO là việc dung hòa giữa các yếu tố kể trên, hungmanh.digital khuyên bạn nên tối ưu và sử dụng cả 2 dạng sitemap để đạt được kết quả tốt nhất.

Phân loại theo định dạng

Có nhiều dạng sitemap được phân loại theo định dạng như:sitemap index, product, category, articles, tag, faq,… tuy nhiên, phổ biến và thường thấy nhất vẫn là 4 dạng sau đây

Image sitemap

Dạng sitemap này chứa đựng những thông tin và dữ liệu của hình ảnh trên website của bạn. Sitemap này được tối ưu để đem lại những kết quả truy vấn khi tìm kiếm hình ảnh trên Google.

News sitemap

Dạng sitemap website  này chưa các nội dung kiểm soát khi gửi thông tin tới Google News. Nhờ đó mà các thông tin được tìm kiếm nhanh chóng hơn khi Google News cố gắng crawl trên website của bạn.

Mobile sitemap

Về cơ bản, sitemap mobile không đem lại hiệu suất tốt hơn trong các bài kiểm tra của Mobile Friendly. Tuy nhiên, nếu website của bạn chứa các trang hiển thị trên thiết bị di động thì đây là một dạng được khuyến khích sử dụng.

Video sitemap

Cũng giống như sitemap website  hình ảnh, sitemap video chứa những dữ liệu và thông tin liên quan đến các nội dung video có trên trang web của bạn. Google cần dạng này để có những trường dữ liệu mà bot không thể tự thu thập, nhờ đó mang lại những phản hồi chính xác khi người dùng truy vấn.

Những trang bắt buộc cần XML sitemap

Trả lời câu hỏi đơn giản dưới đây, bạn sẽ có câu trả lời

Khi người dùng truy vấn trên công cụ tìm kiếm, những trang nào bạn muốn chúng xuất hiện?

Đó là những trang nên có trong XML sitemap. Ngược lại, với một mẹo nhỏ khi bạn không muốn 1 URL cụ thể xuất hiện. Hãy sử dụng các rel “noindex, follow” để ngăn bot Google thu thập và lập chỉ mục đối với URL đó.

Một vài tài liệu Google đưa ra cho biết. XML sitemap đem lại hiệu quả với hầu hết trang web. Tuy nhiên có lợi cực kì lớn với những trang web:

  • Có dung lượng lớn hoặc vô cùng lớn
  • Số lượng URL nhiều
  • Hệ thống backlinks còn hạn chế
  • Có hệ thống đa phương tiện phong phú

Có thể kết luận rằng, tất cả trang web đều cần có sitemap để có thể dễ dàng được lập chỉ mục và hiển thị trên công cụ tìm kiếm. Nhờ đó mà Google có thể có những thông tin cần thiết và thời gian cập nhật lần cuối là khi nào.

Cách tạo sitemap cho website đơn giản và dễ dàng

Hiện tại có nhiều nền tảng website. Phổ biến nhất là 2 dạng WordPress và website không sử dụng WordPress.

Cách tạo sitemap cho website sử dụng nền tảng WordPress

Bước 1: Truy cập trang quản trị WordPress tại địa chỉ example.com/wp-admin/

Bước 2: Cài đặt 1 trong các plugin như Yoast SEO, RankMath hoặc Google XML Sitemap. Ở đây hungmanh.digital hướng dẫn với plugin Yoast SEO.

vi-du-ve-plugin-rankmath-tao-sitemap
Trình tạo sitemap của plugin RankMath

Bước 3: Tại phần Setting của Yoast SEO, tìm kiếm tới mục Content Types tại menu phía bên trái, click vào Search Appearance

Trong các tab Content Type, Taxonomies hoặc Archives Tabs. Mỗi tab sẽ có một phần điều khiển cho phép bạn tùy biến và tối ưu hóa nội dung muốn gửi tới công cụ tìm kiếm.

bat-dau-cai-dat-yoast
Khởi tạo cài đặt Yoast SEO

Ở đây sẽ cho phép bạn chuyển đổi, thêm, xóa một thành phần khỏi XML sitemap. Hãy lựa chọn bật hoặc tắt các thành phần theo ý muốn của bạn.

Bước 4: Tại các tab TaxonomiesArchives, bạn có thể cho hiển thị Tag và Categories. Sau đó tối ưu hóa các đơn vị phân loại.

Bước 5: Tùy chỉnh sitemap, sau đó click XML Sitemap Index để mở tab mới. Hãy kiểm duyệt và bỏ chọn các trang kém giá trị trong sitemap trước khi gửi đi. Trên nền tảng WordPress thường xuất hiện các trang “rác” như hello world, testing,…

them-hoac-xoa-noi-dung-trong-sitemap
Thêm hoặc xóa thành phần trong sitemap

Loại trừ các trang này bằng cách click vào Edit Page ở đầu trang.

Trong trình chỉnh sửa, kéo xuống dưới vào phần Metabox Yoast SEO. Chọn biểu tượng bánh răng cài đặt. Sau đó chuyển “Allow search engines to show this Page in search results?” thành “No”.

Nếu bạn không muốn các trình thu thập dữ liệu liên kết trực tiếp đến trang. Hãy chuyển “Should search engines follow links on this Page?” đặt thành “Yes”.

Cuối cùng click Update để lưu lại các cài đặt. Lặp lại các bước ở phần này để loại trừ từng trang bạn không muốn xuất hiện trong sitemap.

Cách tạo sitemap cho website không sử dụng nền tảng WordPress

Một công cụ online với tên XML-Sitemaps.com cho phép bạn tạo sitemap để áp dụng cho website của mình.

giao-dien-trinh-tao-sitemap-online
Giao diện trình tạo sitemap online

Các bước thực hiện như sau:

Bước 1: Truy cập http://www.xml-sitemaps.com/

Bước 2: Nhập thông tin cho các trường cần thiết

Có thể kể tới các trường như sau:

  • Starting URL: Gõ địa chỉ website của bạn vào
  • Change Frequency: Nên chọn là daily (bạn có thể chọn thông số phù hợp)
  • Last Modification: Nên chọn Use Server’s Response
  • Priority: Nên để tự động (Automatically Calculated Priority)

Hoàn tất nhập thông tin, hãy nhấp chọn Start. Hệ thống sau khi hoàn tất sẽ trả về 1 danh sách các tệp sitemap. Hãy quan tâm tới các tệp sitemap.xml, ror.xml, sitemap.html và urllist.txt

Bước 3: Tải xuống file ở định dạng XML

Chỉnh sửa các thông số Priority- Ưu tiên bằng công cụ notepad theo mong muốn.

Bước 4: Truy cập hosting để upload file XML sitemap vừa chỉnh sửa.

Bước 5: Truy cập Google Search Console, sau đó gửi sitemap tại phần Sơ đồ trang web

Checklist tối ưu website sitemap hỗ trợ SEO dễ dàng

Với danh sách dưới đây, hungmanh.digital tin rằng sitemap của bạn sẽ góp phần thúc đẩy SEO hiệu quả nhất. Bởi sitemap website không những đem những thông tin tới cho công cụ tìm kiếm mà còn đem lại những giá trị tuyệt vời trên trang web của bạn. Cùng tìm hiểu các bước tối ưu dưới đây.

Tạo sitemap tự động bằng plugin

Sitemap hiện tại đã có thể được tạo nhanh chóng và dễ dàng bởi nhiều công cụ hỗ trợ như đã nói ở phần trên. Các plugin có thể kể tới như Yoast SEO, RankMath, XML sitemaps hay công cụ tạo sitemap online.

vi-du-ve-plugin-rankmath-tao-sitemap
Trình tạo sitemap của plugin RankMath

Ngoài ra, việc tạo sitemap bằng cách thủ công cũng không phải khó khi có thể làm theo cấu trúc. Bạn hoàn toàn có thể sử dụng định dạng văn bản bình thường để tạo file và phân chia theo URL trên từng dòng.

Với những người có chuyên môn sâu, họ có thể tạo ra các file sitemap website với các thuộc tính hreflang. Bạn có thể không cần hiểu quá sâu về thuộc tính này. Do đó, hãy ưu tiên sử dụng các plugin tạo sitemap website  tự động để hạn chế lỗi và tiết kiệm thời gian nhất.

Khai báo sitemap tới Google thông qua Search Console

Tương tự với việc index URL, sitemap cũng hoàn toàn có thể khai báo với Google thông qua Google Search Console (tên cũ là Webmaster Tool).

submit-sitemap-trong-google-search-console
Submit sitemap trong Google Search Console

Bạn có thể truy cập GSC và gửi đường dẫn sitemap tại mục sơ đồ trang web.

Đừng quên test kiêm tra sitemap của bạn trước khi submit để tránh các lỗi không mong muốn.

Google cho biết rằng không phải toàn bộ các URL có trong sitemap website đều sẽ được index.

Những lợi ích của việc submit sitemap mang lại đó là:

  • Giúp Google có thể nắm rõ cấu trúc trang web của bạn
  • Phát hiện lỗi, đảm bảo các URL được lập chỉ mục chính xác, đúng cách. Đẩy nhanh tiến độ index mà bớt phụ thuộc vào backlinks.

Ưu tiên site có chất lượng tốt trong tệp sitemap của bạn

Một yếu tố quan trọng trong SEO có thể bạn đã biết là chất lượng trang web. Các yếu tố này ảnh hưởng trực tiếp tới thứ hạng website trên Google. Bạn thử nghĩ rằng, một sitemap website gửi đi mà chứa quá nhiều URL kém chất lượng. Điều này đồng nghĩa với việc rằng Google hiểu website bạn chất lượng không cao.

Do đó, hãy cố gắng ưu tiên các site chất lượng cao mà bạn muốn bot hướng đến, thu thập dữ liệu. Đây có thể là các trang quan trọng trong website. Đặc điểm nhận biết các site này có thể kể đến như:

  • Tối ưu hóa thân thiện với công cụ tìm kiếm
  • Chứa video, hình ảnh, media
  • Nội dung rõ ràng, rành mạch, chuyên biệt
  • Được tham gia bởi người dùng như review, rate,…

Xử lý các vấn đề liên quan đến index sitemap

Mình đã nhắc bên trên, không phải tất cả các site được gửi thông qua sitemap sẽ được lập chỉ mục.

Nhiều nhà quản lý đã chia nhỏ các thành phần không được lập chỉ mục để thử nghiệm. Cho đến phiên bản hiện tại. Google Search Console đã thông báo các vấn đề để bạn khắc phục thông qua “Các vấn đề lập chỉ mục”. Hãy khắc phục các vấn đề này để đảm bảo hiệu suất index cao nhất.

Tạo sitemap có chứa phiên bản canonical

Đa số trên website sẽ có các trang có hình thức hoặc nội dung giống nhau. Ví dụ như các biến thể của 1 sản phẩm, chỉ khác nhau về size. Do đó, hãy sử dụng thẻ canonical để thông báo cho Google biết rằng trang nào sẽ là phiên bản chính.

Cũng như các site bình thường. Thẻ canonical xuất hiện trong sitemap website sẽ giúp cho bot thu thập dữ liệu và index hiệu quả hơn.

Ưu tiên sử dụng Robots Meta thay cho Robots.txt

Muốn loại một trang khỏi lập chỉ mục trên Google, hãy sử dụng các tag “noindex, follow”. Các tag này được định nghĩa là Robots Meta.

robot-meta-voi-plugin-rankmath
Tùy chọn Robots Meta trong plugin RankMath

Việc đặt các thẻ tag Robots Meta này giúp URL không được cào dữ liệu và lập chỉ mục. Tuy nhiên, sức mạnh và các giá trị sẽ được bảo toàn. Nên áp dụng các tag này cho các trang quan trọng nhưng không nên xuất hiện trên trang kết quả tìm kiếm.

Ngược lại, với robots.txt khi các site đó muốn chặn hẳn và áp dụng với các trang không quan trọng.

Nói không với các URL “noindex” trong sitemap

Sitemap như một bản đồ dẫn đường cho bot. Do đó, đã không muốn thu thập dữ liệu thì đừng đưa chúng vào sitemap mặc dù đã chặn noindex.

Lý giải cho điều này, Google cho biết đây sẽ làm cho bot hiểu nhầm website thiếu tính nhất quán, dẫn tới các ảnh hưởng không mong muốn trong quá trình lập chỉ mục.

Hãy chỉ đưa các trang cần thiết và muốn được lập chỉ mục vào sitemap.

Sử dụng các tool tự động tạo XML sitemap cho những domain chứa nhiều thông tin

Với những trang vừa và nhỏ, việc quản lý từng URL đã vô cùng khó khăn. Điều đó càng không thể với những domain có số lượng URL đồ sộ. Hãy ưu tiên thiết lập các quy tắc để đưa những URL vào sitemap. Ví dụ như khi thay đổi từ tag “noindex” qua “index, follow”.

Hiện tại có rất nhiều tool hoặc plugin hỗ trợ việc này.

XML sitemap website là gì và RSS/Atom Feeds

Đây là một dạng XML, có thể hiểu rằng công dụng chính là tóm tắt thông tin.

RSS có nhiệm vụ ping cho các công cụ tìm kiếm mỗi khi trang của bạn có sự thay đổi hoặc cập nhật. Hiểu đơn giản, khi bạn thay đổi một nội dung hoặc xuất bản nội dung mới, Google hoặc các công cụ tìm kiếm sẽ nhanh chóng có được thông tin của bạn.

Điều này sẽ đem lại việc tìm kiếm nội dung mới nhanh chóng cho cả công cụ tìm kiếm hoặc người dùng.

Chỉ cập nhật khi có những thay đổi lớn, cực kì quan trọng

Các Bot hoạt động dựa trên hoạt động của người dùng. Và chúng đủ thông minh để biết khi nào trang của bạn cần thu thập dữ liệu lại. Do đó, đừng cố lừa chúng lập chỉ mục lại bằng việc spam sitemap.

submit-sitemap-trong-google-search-console
Chỉ cập nhật sitemap website khi có sự thay đổi rõ rệt

Bạn có thể nhận nhiều án phạt từ Google như xóa hoàn toàn ngày đăng tải nếu họ không phát hiện được nội dung cập nhật mới nào trong khi bạn ping cập nhật liên tục. Hãy chỉ cập nhật thời gian sửa đổi nếu thật sự có những thay đổi rõ rệt trên trang của bạn.

Không đặt nặng Priority – Ưu tiên trong sitemap website là gì

Một số trình tạo sitemap có xuất hiện cột Priority. Khi đọc cột này, bots hiểu rằng các trang đó cần được ưu tiên và có tính quan trọng cao. Qua thời gian, một số technical cho rằng tính năng này đã bị Google bỏ qua.

Tối ưu file sitemap có dung lượng nhẹ nhất có thể

Dù là gì, thì dung lượng càng nhỏ, máy chủ càng bớt áp lực. Dung lượng file sitemap website tối đa đã được cập nhật lên tới 50MB vào năm 2016. Tuy nhiên, việc giữ dung lượng sitemap nhẹ nhàng nhất có thể luôn được khuyến khích.

Sử dụng nhiều sitemap thay vì 1 nếu website có nhiều hơn 50.000 URL

50.000 URL là con số tối đa mà 1 file sitemap có thể lưu trữ

Đa số các website đang hoạt động tại Việt Nam đều không sử dụng hết con số này. Tuy nhiên với những trang có nhiều hơn thì cũng đừng quá lo lắng. Các công cụ tìm kiếm cho phép bạn gửi nhiều file sitemap khác nhau đồng thời. Hãy tận dụng chúng.

Tổng kết về Sitemap là gì? Cách tạo sitemap cho website tối ưu SEO nhanh chóng và dễ dàng

Như vậy qua bài viết trên đây, chúng ta đã cùng nhau tìm hiểu về website sitemap. Bạn đã hiểu sitemaps là gì và cách tạo sitemap cho website như thế nào rồi đúng không. Đừng quên để lại một góp ý phía bên dưới để cùng thảo luận về sitemap website là gì hay technical SEO cùng hungmanh.digital nhé.

Mạnh Hùng Blog – Blog số và hơn thế nữa

Facebook: Nguyễn Mạnh Hùng

Zalo: Nguyễn Mạnh Hùng

Instagram: @hungmanh.digital

0/5 (0 Reviews)

2 thoughts on “Sitemap là gì? Cách tạo sitemap cho website nhanh chóng

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *