Truyện Cười BlogTaPhiet KC

Chat Box


--------------:Search

Thứ Sáu, 6 tháng 1, 2012

Lấy dữ liệu Blogspot khác và Bảo vệ dữ liệu blogspot bản thân.



Các bước Lấy data của blogspot khác hay gọi lịch sự là lấy data, mà gọi không lịch sự là đi ăn cắp. Mình cũng từng bị một tên ăn chộm dự liệu bê y nguyên 2400 bài viết của mình về và upload lên host của tên vô lại đó. Các bạn có thể xem trang của tên vô lại đóTẠI ĐÂY
Mình viết bài này không khuyến khích các bạn làm thế vì mình từng là nạn nhân nên mình rất hiểu tâm trạng của người bị hại sẽ như thế nào. Dưới đây là các thủ đoạn ăn chôm của những kẻ đi choom:

- Bước 1- xác định blogspot cần lấy  phải thỏa mãn điều kiện rss của nó phải là rss full, rss không bật full thì chỉ lấy phần giới thiệu
- Để xác định rss là full hay không chỉ cần đánh tên địa chỉ web như sau vào :
http://diachi.blogspot.com/atom.xml
Thay: diachi thành tên blog cần lấy 
Ví dụ: http://namkna.blogspot.com/atom.xml
(Tất nhiên sau sự cos mất cawops mình đã fix lại rồi nên các bạn đừng thắc mắc tại sao chỉ có phần trích dẫn nha).
- Nếu rss được bật full thì ta có thể lấy toàn bộ data. còn không thì dừng ở đây được rồi. Có một số template yêu cầu bắt buộc phải  bật full rss như template Simplex Celebrity .... các trang tin hot teen hay dùng lắm, và một số Blogger mới vào nghề chưa biết hay quyên.
- Bước 2: Xác định tổng số bài  viết có trong blogspot đó bằng cách tạo một bài viết mới và Pate co bên dưới vào phần html:
<script style="text/javascript">
function showpostcount(json) {
document.write('<center>Tổng số bài: <b>' + parseInt(json.feed.openSearch$totalResults.$t,10)
+ '</b></center>');}</script>
<script src="http://namkna.blogspot.com/feeds/posts/default?alt=json-in-script&callback=showpostcount"></script>
<script style="text/javascript"></script>
Thay: namkna.blogspot.com bằng tên blog bạn cần khi đó sẽ hiển thị số bài đăng như sau:




Tổng số bài: 2672


Cần xác định số bài đăng vì vì 1 số blogspot khủng data > 10000 bài nên sẽ  chia nhỏ thành các đoạn data ,sau đó lấy theo khỏang từ 1-50 bài hay 1-10 bài tùy đường truyền mạng hay cấu hình máy. Blogspot cho import tối đa 500 bài.
- Bước 3: copy và paste đoạn cần lấy vào chương trình download IDM  khi đó sẽ là nếu máy ai chưa cài IDm có thể download TẠI ĐÂY. Ví dụ đoạn link dưới đây là lấy từ bài 1 đến bài 10 kể từ bài đăng mới nhất.
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=10
Trong đó: 
  • start-index=1  bắt đầu bài đăng mới nhất 
  • max-result=10  lấy từ bài 1 đến bài thứ 10 
  • diachi.blogspot.com: là blog cần lấy Data
- Khi đó IDM sẽ cho ra 1  file  .xml . Cứ thế lấy tiếp đến hết data thì thôi:
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=11&max-results=10
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=21&max-results=10
..................................
- Sau đó ta  thu được các file .xml (chuẩn rss hình như wordpress cũng cho phép import rss vào- chưa thử )
- Bước 4:  Import file xml đó vào blogspot  bằng cách vào  Setting  ( Cài đặt ->  Import. done  (  Nhập Blog ) - Chỉ đường dẫn tới các file  .XML  mà bạn vừa download về.

-chú ý : khi  import   xong nên đăng lấy lệ 1 vài bài để xóa bỏ  capchar  khi import quá nhiều bài 1 lúc, google săm soi blog sẽ cho là spam sẽ disable acc .

P/s by Namkna: tránh cho blog của bạn bằng cách tắt chức năng full này đi bằng cách vào Setting  ( Cài đặt ->  Nguồn cấp dữ liệu trang Web  -> tại mục Cho phép nguồn cấp dữ liệu Blog bạn chọn  Cho đến dấu ngắt .
Nếu template bắt buộc đặt full thì ta nên tạo thêm  1 đoạn giới thiệu ,để  khi bài được mang vác khắp nơi người đọc biết nguồn xuất phát từ đâu khi có ai dùng( 1 số hay quên ghi tác giả như mình đây)
Chúc các bạn ngăn chặn hiệu quả!
Share/Save/Bookmark

1 comment

lúc 04:14 6 tháng 1, 2012

gfjhfdh

Đăng nhận xét

More →
Chữ đậm Chữ nghiêng Chữ nghiêng 2 Chèn Link Chèn Link Mã hóa code Help ?Nhấn vào biểu tượng hoặc kiểu chữ hoặc chèn link sau đó nhấn nút Chọn rồi copy (Ctrl + C) để paste (Ctrl + V) vào khung viết bình luận. Mã hóa code nếu bạn muốn đưa code vào bình luận.

Chọn Xóa
Top