Bây giờ có một cách tốt hơn để lấy dữ liệu của bạn - Hình ảnh của tác giả - Được tạo bởi Canva Chúng ta đều đã khám phá ra ma thuật của ChatGPT trong tất cả các lĩnh vực. Cá nhân tôi rất muốn khám phá ma thuật của nó trong Khoa học Dữ liệu. Trước đó, tôi đã thành công trong việc sử dụng nó trong Học Máy và Trực quan hóa Dữ liệu. Bây giờ tôi đang tự hỏi, liệu chúng ta có thể làm điều tương tự với Web Scraping không? Tại sao bạn cần lấy dữ liệu của bạn? Tất nhiên, bạn có thể sử dụng các bộ dữ liệu Kaggle, nhưng điều đó sẽ làm cho hồ sơ của bạn trở nên thông thường, và tin tôi, bạn không muốn điều đó xảy ra. Lấy Dữ liệu Web với ChatGPT Lấy dữ liệu trang web có thể là một quá trình khó khăn và tốn thời gian, nhưng ChatGPT đã cách mạng hóa cách thực hiện nó. Hiện có nhiều thư viện Lấy Dữ liệu Trang web khác nhau tồn tại trong Python, tuy nhiên ở đây chúng tôi sẽ tìm hiểu về 4 thư viện nổi tiếng. Trong bài viết này, chúng tôi sẽ đi sâu vào các khái niệm cơ bản về lấy dữ liệu trang web với các công cụ phổ biến như BeautifulSoup, Selenium, Requests và Scrapy. Bằng cách sử dụng các thông báo này, bạn sẽ có thể khám phá những thư viện này chỉ trong vài giây. Trước khi tiếp tục, hãy bắt đầu với Lấy Dữ liệu Web Cơ bản trước, sau đó chúng ta sẽ đi sâu vào ràng buộc của Lấy Dữ liệu Web. Cảm ơn bạn đã đọc đến đây, nếu bạn vẫn không phải là thành viên của Medium và muốn học bằng cách đọc, đây là liên kết giới thiệu của tôi. Tôi liên tục tăng số lượng Cheat Sheet và Source Code cho bạn. Tuần này tôi đã tạo ra một Cheat Sheet ChatGPT và tin tôi kể từ khi ChatGPT được phát hành, tôi không nhớ một ngày nào tôi không sử dụng ChatGPT. Bạn cũng có thể chọn một trong các Bảng tờ Cheats hoặc dự án để tôi gửi cho bạn bằng cách điền vào các biểu mẫu sau;