เคล็ดลับ หนึ่งที่รวดเร็วในการค้นพบ Amazon เรียกดูโหนด

หมวดหมู่ Amazon ของผลิตภัณฑ์ในการจัดเก็บในประเภทสถิติที่รู้จักกันทั่วไปว่า "โหนด" แต่ละ โหนดเหล่านี้มีการจัดอันดับแล้วในระดับที่ชัดเจนและจากทางทฤษฎีที่สะท้อนให้เห็นถึง "ผู้ปกครองโหนด" และ "โหนดใบมีด" ใบโหนดแม่นยำมากขึ้นและ subclass โครงสร้างโหนดแม่เฉพาะเจาะจงมากขึ้น ในคำอื่น ๆ แทนพ่อแม่นอตหมวดหมู่ทั่วไปของผลิตภัณฑ์และแต่ละใบมีดหรือ "เด็ก" สะท้อนให้เห็นถึงหมวดหมู่ย่อยที่เฉพาะเจาะจงและมีความเกี่ยวข้อง ยกตัวอย่างเช่นโหนด 283,155 โหนดแม่สำหรับ "หนังสือ" และโหนด 5 สะท้อนให้เห็นถึง "คอมพิวเตอร์และเทคโนโลยีหนังสือ" – ชนิดพิเศษของหนังสือเล่มนี้ ในตัวอย่างนี้ 283 155 ผู้ปกครองและ 5 เป็นบุตรหลานหรือหนังสือพิมพ์ของคุณ ในปัจจุบัน, Amazon ภูมิใจนำเสนอ 100,000 โหนด แต่มีคนอีกจำนวนมากที่ไม่สามารถเข้าถึงผ่าน API หรือไม่ได้มีข้อมูลที่เป็นประโยชน์

ขั้นตอนที่จะค้นพบทุกโหนดอเมซอนจะทำโดยการร้องขอ API หลาย อย่างน้อยหนึ่งคนที่สองควรผ่านแต่ละคำขอส่วนบุคคลสำหรับเพื่อนร่วมงานมากที่สุด เพราะอเมซอนไม่ได้มีจุดเริ่มต้นในรถบัสหลักที่มีพ่อแม่ทุกคนก็สามารถจะเสียเวลาในการค้นหาโหนดทั้งหมด

ที่ Stange รายการดาวหลักที่มีพ่อแม่ทุกคนไม่ได้อยู่ในอเมซอน API ขั้นตอนแรกในการสร้างฐานข้อมูลในหมวดโหนดเป็นรายการประเภทที่มีความหลากหลายและเกี่ยวข้องกับโหนดของพวกเขา รายการที่แตกต่างกันของประเภทที่พบในสถานที่หนึ่งที่สามารถพบได้บนหน้าเว็บ "อเมซอนไดเรกทอรีของไซต์" เห็นได้ชัดว่าเว็บไซต์นี้จะรวมถึงการเชื่อมโยงที่จะช่วยให้เครื่องมือค้นหาเพื่อค้นหาผลิตภัณฑ์และลึกลงไปจะเป็นตัวแทนของทุก Amazon ที่จะนำเสนอ ส่วนใหญ่ของการเชื่อมโยงในหน้านี้รวมถึง URL โหนดเฉพาะพบกับ PHP หลังจาก HTML ที่ยอมรับไม่ได้และคัดลอกข้อมูลอ้างอิงได้ถูกลบออกจากการเชื่อมโยง HTML และได้รับการบันทึกในเมืองลงในฐานข้อมูล MySQL ในตาราง SampleNode_US ในรูปแบบของ โหนหนึ่งในแถว

] ณ จุดนี้อยู่ในแต่ละแถว SampleNode_US แผ่นผ่าน API ได้ แต่ครั้งนี้มีวัตถุประสงค์เพื่อตรวจสอบบรรพบุรุษของแต่ละแถว คัดลอกบรรพบุรุษกลับมาจาก API ข้อมูลจะถูกลบออกและผลที่มีการเพิ่มจากนั้นไปที่ตารางฐานข้อมูลของคุณ RootNode_US ด้วยวิธีนี้เช่นหมายเลขบันทึกรากมีพ่อแม่ทุกคนโดยการจัดระเบียบข้อมูลที่ได้รับจากการใช้ API

สุดท้ายย้ายแต่ละแถวในตาราง RootNode_US ผ่าน API เพื่อเด็ก หมวดโหนด ID เด็กแต่ละคนเรียกดูโหนดในทางกลับกันก็ยังได้รับการอนุมัติใน API ในเด็กที่ลึกที่สุด เมื่อคุณไม่สามารถหาลูกอีกแล้วโหนดแม่ต่อไปหรือเด็กโหลดและเรียกว่า ทำซ้ำขั้นตอนจนกว่าแต่ละโหนดได้รับการตรวจสอบสำหรับเด็กทุกคน ผลการค้นหาจะถูกเก็บไว้และ / หรือปรับปรุงในตาราง Node_US มันต้องใช้เวลาประมาณ 2-3 สัปดาห์สำหรับสคริปต์ที่จะแยกโหนดทั้งหมดเกี่ยวกับเงื่อนไขการหน่วงเวลาที่จำเป็นของการร้องขอ API

Source by T. Grijalva Jr.

Leave a Reply

Your email address will not be published. Required fields are marked *