Hãy đăng ký thành viên để có thể dễ dàng trao đổi, giao lưu và chia sẻ về kiến thức lập trình.

Hướng dẫn cách sử dụng Screaming Frog

Thảo luận trong 'Công cụ SEO' bắt đầu bởi nokia1202, 9/3/16.

  1. nokia1202
    Offline

    nokia1202 New member

    Bài viết:
    69
    Đã được thích:
    0
    Nếu bạn chưa quen với thế giới của Internet marketing và có ai đó nói với bạn rằng bạn nên sử dụng Screaming Frog, bạn sẽ nghĩ gì? Tôi có thể nghĩ rằng họ đang bị điên. Mặc dù Screaming Frog là một công cụ tuyệt vời nhưng có rất ít người biết đến.

    screaming-frog

    Vậy Screaming Frog là gì?

    Bây giờ, khi mọi người nói về Screaming Frog, chúng ta không thể không nhắc đến về công ty và các dịch vụ marketing web của họ. Tôi sẽ cho bạn biết cách để sử dụng các công cụ miễn phí mà họ cung cấp và một trong số đó là Screaming Frog SEO Spider Tool.

    Spider là một phần của phần mềm crawl trên một trang web, dữ liệu được khai thác và hiển thị nó cho chủ sở hữu của spider.

    Spider đặc biệt này là một ứng dụng desktop mà bạn có thể tải về và chạy nó từ chính máy tính cá nhân của bạn. Nó fetch dữ liệu SEO, bao gồm URL, dữ liệu meta, schema và nhiều hơn nữa.

    Lợi ích chính của Screaming Frog Spider là khả năng tìm kiếm và lọc các vấn đề SEO. Bạn không cần phải có một kiến thức sâu về SEO để tìm ra những gì thực hiện đúng và không được thực hiện đúng, công cụ này sẽ giúp lọc điều đó cho bạn. Nó có thể tìm thấy những trang chuyển hướng xấu, refresh meta, các trang trùng lặp, thiếu dữ liệu meta và nhiều hơn nữa.

    Công cụ này cực kỳ mạnh. Dữ liệu mà nó thu thập bao gồm lỗi máy chủ và lỗi liên kết, chuyển hướng, URL bị chặn bởi robots.txt, liên kết internal và external và trạng thái của chúng, tình trạng bảo mật của các liên kết, các vấn đề URL, vấn đề với tiêu đề trang, meta data, thời gian đáp ứng trang, đếm số từ, canonicalization, liên kết anchor text, hình ảnh với các URL, kích thước, alt text và còn nhiều hơn nữa.

    Về cơ bản, khi tôi nói chuyện về việc audit một trang web hoặc audit nội dung, tôi khuyên bạn nên sử dụng Screaming Frog. Ngoài ra, công cụ này được thực hiện với SEO friendly, nó tuân thủ theo chuẩn AJAX (Francis) của Google cho việc thu thập web.

    Hiện nay, công cụ phổ biến là Lite, bạn có thể tải về và sử dụng nó miễn phí. Tuy nhiên nó cũng có một số giới hạn mà bạn cũng cần phải chú ý. Chủ yếu là bạn chỉ có thể crawl 500 URL và bạn không tiếp cận được với một số tùy chọn như tích hợp Google Analytics và một số tính năng khác.

    Tôi khuyên bạn, nếu bạn có một trang web lớn với hơn 500 URL, bạn hãy mua license đầy đủ của nó. Đây là khoản phí hàng năm với chỉ 99 Bảng Anh và hầu hết các doanh nghiệp có thể dễ dàng mua được nó và nó cũng đáng đồng tiền bát gạo.

    Theo mặc định, Screaming Frog tuân theo các chỉ thị giống như Googlebot, bao gồm cả thẻ nofollow và noindex trong trong robots.txt của bạn. Tuy nhiên, nếu bạn muốn, bạn có thể sử dụng nó với user agent riêng với “Screaming Frog SEO Spider”. Điều này cho phép bạn kiểm soát nó trực tiếp hơn và có khả năng cung cấp cho nó nhiều truy cập hơn mà Google nhận được.

    Hướng dẫn sử dụng Screaming Frog

    Với mọi kích thước của trang web, trừ khi bạn chắc chắn 100% rằng mình đã làm tất cả mọi thứ và bạn thực hiện đúng. Giả sử rằng bạn đang sử dụng phiên bản đầy đủ của Screaming Frog để chắc chắn rằng bạn đã không bỏ lỡ bất cứ điều gì.


    Nó rất rẻ, bạn chỉ cần mua license.

    - Click vào menu configuration và click spider

    - Trong menu, click vào “crawl all subdomains” để kiểm tra nó. Bạn có thể crawl CSS, JavaScript, SWF và các liên kết external để có một cái nhìn đầy đủ về trang web của bạn. Bạn có thể uncheck nếu bạn muốn thu thập dữ liệu nhanh hơn với các trang và văn bản mà không có media và script.

    - Tiến hành thu thập dữ liệu và chờ đợi để nó thực hiện. Nó cũng được giới hạn bởi sức mạnh xử lý và bộ nhớ mà bạn đã phân bổ cho chương trình. Với máy tính có cấu hình mạnh hơn, nó sẽ crawl nhanh hơn.

    - Click vào tab internal và lọc kết quả của bạn theo HTML. Click để export. Bạn sẽ nhận được một tập tin CSV chứa tất cả dữ liệu được thu thập, sắp xếp theo trang HTML riêng và sửa chữa chúng một cách nhanh chóng và dễ dàng.

    Nếu bạn thấy Screaming Frog bị treo khi thu thập một trang web lớn, rất có thể đó là vấn đề về bộ nhớ. Spider sẽ sử dụng tất tất cả các bộ nhớ có sẵn cho nó và đôi khi nó sẽ cao hơn mà máy tính của bạn cho phép để xử lý. Để tránh điều này, dưới Advanced, kiểm tra “pause on high memory usage". Nó sẽ tạm dừng spider khi nó ngốn quá nhiều nguồn tài nguyên để xử lý.

    Nếu bạn thấy trình thu thập của bạn bị hết thời gian, có thể là do máy chủ không xử lý được nhiều yêu cầu mà bạn muốn gửi. Để đánh giá giới hạn của việc thu thập của bạn, click vào submenu speed trong menu configuration và chọn một giới hạn mà bạn muốn.

    Nếu bạn muốn sử dụng proxy khi thu thập thông tin của bạn bạn sẽ cần phải click vào configuration và click proxy. Từ bên trong menu này, bạn có thể thiết lập một proxy của riêng bạn. Screaming Frog hỗ trợ khá nhiều loại proxy bạn muốn sử dụng.

    Thực hiện audit liên kết với Screaming Frog

    Rất khó để audit các liên kết. Dưới đây là cách bạn làm với spider.

    - Trong menu configuration spider, kiểm tra tất cả các subdomain nhưng không kiểm tra CSS, image, JavaScript, Flash và bất kỳ tùy chọn khác mà bạn không cần. Nếu bạn muốn thu thập các liên kết nofollow và kiểm tra các box tương ứng.

    - Tiến hành thu thập dữ liệu và để cho chạy cho đến khi nó hoàn tất.

    - Click vào menu Advanced Report và click “All Links” để tạo và export tập tin CSV của tất cả các liên kết mà nó crawl, bao gồm cả vị trí của chúng, đích đến của chúng, anchor text, chuyển hướng và các dữ liệu khác.

    Từ đó, bạn có thể export dữ liệu hoặc bạn có thể sắp xếp nó theo ý thích của bạn. Dưới đây là một số sắp xếp và hành động mà bạn có thể thực hiện.

    - Nhấp vào tab internal và sắp xếp theo outlinks. Nó sẽ cho bạn thấy những trang với hầu hết các liên kết trên trang web của bạn.

    - Click vào tab internal và click vào status code. Bất kỳ liên kết hiển thị mã trạng thái 404 đó là các liên kết bị hỏng và bạn sẽ muốn sửa chữa các liên kết này. Với các liên kết mà trong báo cáo có chứa 301 hoặc chuyển hướng khác có thể được chuyển hướng đến trang chủ hay các trang độc hại; kiểm tra và xác định xem chúng có cần phải loại bỏ hay không. Bạn cũng có thể tạo các báo cáo cụ thể với nhiều loại khác nhau của mã trạng thái - 3XX, 4xx, hoặc 5XX cho chuyển hướng, lỗi client hoặc lỗi máy chủ tương ứng - dưới báo cáo Advanced Report.

    - Hướng dẫn này cho bạn thấy làm thế nào để sử dụng Majestic và Screaming Frog để tìm các liên kết internal.

    Thực hiện audit nội dung với Screaming Frog

    [​IMG]
    Audit nội dung là rất quan trọng bởi có hàng nghìn các yếu tố xếp hạng tìm kiếm quan trọng nhất hiện nay là đề cập đến nội dung. Tốc độ trang web, tích hợp HTTPS, tích hợp điện thoại di động, Schema.org; tất cả những điều này là quan trọng nhưng chúng không quan trọng bằng nội dung chất lượng cao, hình ảnh tốt và không trùng lặp.

    - Thực hiện crawl trang web đầy đủ bao gồm cả CSS, image, hình ảnh, script và tất cả những phần còn lại. Càng nhiều dữ liệu càng tốt.

    - Trong tab internal, lọc theo HTML, sau đó di chuyển đến cột word count và sắp xếp từ thấp đến cao. Các trang có dưới 500-1000 từ là những nội dung sơ sài, xác định xem chúng có cần cải thiện, noindex hoặc gỡ bỏ hoàn toàn.

    - Trong tab images, lọc theo “missing alt text” để tìm hình ảnh được giữ lại trên trang web của bạn do không có alt text liên quan đến hình ảnh. Bạn cũng có thể lọc theo “alt text over 100 characters” để tìm hình ảnh với quá nhiều alt text mà nó gây bất lợi cho trải nghiệm người dùng và thứ hạng tìm kiếm của bạn.

    - Trong tab tiêu đề trang, lọc những tiêu đề có hơn 70 ký tự. Google sẽ không hiển thị nhiều hơn thế vì vậy bạn hãy lọc và cắt hoặc chỉnh sửa tiêu đề để loại bỏ quá nhiều ký tự không có lợi cho bạn.

    - Trong cùng một tab tiêu đề trang, lọc theo duplicate để tìm các trang có meta title trùng lặp. Title trùng lặp sẽ chỉ ra nội dung trùng lặp và nó có thể là một hình phạt của Panda và có thể ảnh hưởng nghiêm trọng đến tìm kiếm thứ hạng của bạn. Nếu các trang của bạn là duy nhất, hãy thay đổi title của chúng để phản ánh nội dung của chúng. Nếu các trang là trùng lặp, hãy loại bỏ nó và chuyển hướng nó hoặc canonicalize nội dung nếu cần thiết.

    - Trong tab URL, lọc theo duplicate để tìm các vấn đề trùng lặp tương tự mà cần chuẩn hoá để sửa chữa.

    - Trong tab meta description, lọc theo duplicate để tìm meta description bị trùng lặp trên các trang duy nhất. Hãy sửa chữa chúng càng sớm càng tốt bởi nếu không chúng sẽ làm tổn thương trang web của bạn.

    - Trong tab URL, lọc theo các tùy chọn khác nhau để xác định các trang có URL có đạt tiêu chuẩn hay không hoặc nó có thể đọc được hay không để thay đổi chúng. Điều này đặc biệt quan trọng cho các trang với các ký tự ASCII hoặc có quá nhiều dấu gạch dưới.

    - Trong tab directives, lọc theo bất kỳ các directives mà bạn muốn để xác định các trang hoặc các liên kết mà có các chỉ thị gắn liền với chúng. Các chỉ thị bao gồm index/noindex, follow/nofollow và một vài chỉ thị khác ít phổ biến. Điều này cũng có thể được sử dụng để xác định nơi canonicalization đã được thực hiện.

    Tạo sitemap XML

    Sitemaps là vô cùng hữu ích với Google bởi chúng sẽ chỉ cho các công cụ tìm kiếm biết tất cả các trang của bạn. Bạn có thể tạo sitemap theo những cách khác nhau nhưng Screaming Frog cũng có một phương pháp riêng của nó. Tất cả những gì bạn cần làm là thu thập thông tin trang web của bạn bao gồm cả subdomain. Sau đó click vào menu “Advanced Export” và nhấp vào tùy chọn phía dưới, tùy chọn XML Sitemap. Nó sẽ giống như là một bảng tính Excel, sau đó bạn có thể chỉnh sửa nó. Hãy mở nó và chọn đọc online và "open as an SML table". Bỏ qua cảnh báo được bật lên. Với dạng bảng, bạn có thể chỉnh sửa sitemap của bạn một cách dễ dàng, và bạn có thể lưu nó như một tập tin XML. Khi đã xong, bạn có thể tải nó lên Google.

    Nếu bạn thấy rằng một số phần của trang web của bạn không được index, rất có thể bạn đang gặp vấn đề với robots.txt. Ngoài ra, nếu một trang không có các liên kết internal trỏ đến nó, nó sẽ không được thu thập.


    Nguồn: seotoolsplus
     
    Đang tải...
  2. ganoipho6
    Offline

    ganoipho6 New Member

    Bài viết:
    5
    Đã được thích:
    1
    mình dùng cái này với mục dích kiểm tra liên kết nội bộ là chính :d
    xem cái link nào die để sửa chữa. hoặc hình ảnh lỗi.
     

Ủng hộ iGoSEO

Thành viên đang xem bài viết (Users: 0, Guests: 0)