HTML வலைத்தளங்களிலிருந்து தேவையான தரவை எவ்வாறு பிரித்தெடுப்பது என்பதை செமால்ட் விளக்குகிறது

வலையில் வழங்கப்பட்ட பெரிய அளவிலான தகவல்கள் "கட்டமைக்கப்படாதவை" என்று கருதப்படுகின்றன, ஏனெனில் அது ஒழுங்காக ஒழுங்கமைக்கப்படவில்லை. HTML வலைத்தளங்கள் ஒழுங்கமைக்கப்பட்ட ஆவணங்களைக் கொண்டிருக்கும் விதத்தில் வேறுபட்டவை, மேலும் ஆவணங்களில் வழங்கப்பட்ட உரை அடிப்படை HTML குறியீட்டிற்குள் கட்டமைக்கப்பட்டுள்ளது.

HTML வலைத்தளங்களிலிருந்து மூன்று முக்கிய தரவு பிரித்தெடுக்கும் முறைகள் உள்ளன:

  • வலைப்பக்கத்தில் உள்ள உரையை உங்கள் கணினியில் சேமித்தல்;
  • தரவு பிரித்தெடுப்பதற்கான குறியீட்டை எழுதுதல்;
  • சிறப்பு பிரித்தெடுத்தல் கருவிகளைப் பயன்படுத்துதல்;

1. குறியீட்டு இல்லாமல் வலைத்தளத்திலிருந்து HTML ஐ எவ்வாறு பிரித்தெடுப்பது

கீழே விவரிக்கப்பட்டுள்ள படிகளைப் பயன்படுத்தி வலைப்பக்க உள்ளடக்கத்தை நீங்கள் துடைக்கலாம் :

உரையை மட்டும் பிரித்தெடுக்கிறது

நீங்கள் விரும்பும் உரையைக் கொண்ட வலைப்பக்கத்தைத் திறந்த பிறகு, வலது கிளிக் செய்து "பக்கத்தை இவ்வாறு சேமி" அல்லது "இவ்வாறு சேமி" விருப்பத்தைத் தேர்ந்தெடுக்கவும். "கோப்பு பெயர்" புலத்தில் கோப்பிற்கான பெயரைத் தட்டச்சு செய்து, "வகையாகச் சேமி" கீழ்தோன்றும் மெனுவிலிருந்து, "வலைப்பக்கம், HTML மட்டும்" என்பதைத் தேர்வுசெய்க. "சேமி" பொத்தானைக் கிளிக் செய்து சில விநாடிகள் காத்திருக்கவும்.

அந்தப் பக்கத்தில் உள்ள அனைத்து உரையும் பிரித்தெடுக்கப்பட்டு ஒரு HTML கோப்பாக சேமிக்கப்படும். அசல் பக்க வடிவமைப்பு விருப்பங்கள் அப்படியே உள்ளன, மேலும் நோட்பேட் போன்ற உரை எடிட்டர்களில் உள்ளடக்கத்தை நீங்கள் திருத்தலாம்.

முழு வலைப்பக்கத்தையும் பிரித்தெடுக்கிறது

"கோப்பு" மெனுவில் "இவ்வாறு சேமி" அல்லது "பக்கமாக சேமி" விருப்பத்தைத் தேர்ந்தெடுக்கவும். பின்னர், "வகையாகச் சேமி" கீழ்தோன்றும் மெனுவிலிருந்து "வலைப்பக்கம், முழுமையானது" என்பதைக் கிளிக் செய்க. "சேமி" என்பதைக் கிளிக் செய்த பிறகு, உரையும் படங்களும் பக்கத்திலிருந்து பிரித்தெடுக்கப்பட்டு நீங்கள் விரும்பும் இடத்தில் சேமிக்கப்படும். படங்கள் ஒரு கோப்புறையில் சேமிக்கப்படும் போது உரை ஒரு HTML கோப்பில் வைக்கப்படுகிறது.

2. குறியீட்டைப் பயன்படுத்தி ஒரு வலைத்தளத்திலிருந்து HTML ஐ பிரித்தெடுப்பது

சிறப்பு கருவிகளைப் பயன்படுத்தி நீங்கள் HTML கோப்புகளுடன் நேரடியாக வேலை செய்யலாம். மேலும், எல்லா HTML குறிச்சொற்களையும் அகற்றவும், எக்ஸ்பாத் அல்லது வழக்கமான வெளிப்பாட்டைப் பயன்படுத்தி HTML கோப்புகளில் உள்ள உரையைத் தக்கவைக்கவும் ஒரு குறியீட்டை உருவாக்கலாம். இந்த பணிக்கான மிகவும் பிரபலமான நிரலாக்க மொழிகளில் சில பைதான், ஜாவா, ஜே.எஸ்., கோ, பி.எச்.பி மற்றும் நோட்ஜெஸ் ஆகியவை அடங்கும்.

3. வலை தரவு பிரித்தெடுக்கும் கருவிகளைப் பயன்படுத்துதல்

ஒரு வரியின் குறியீட்டை எழுதாமல் ஒரு வலைத்தளத்திலிருந்து HTML கோப்புகளை பிரித்தெடுக்க விரும்பினால் அல்லது நகல் மற்றும் ஒட்டு முறையின் சித்திரவதைகளைத் தவிர்க்க விரும்பினால், வலை ஸ்கிராப்பிங் கருவிகளைப் பயன்படுத்தவும். உண்மையில், ஒரு வலைத்தளத்திலிருந்து தேவையான தகவல்களை அறுவடை செய்து பின்னர் அதை கட்டமைக்கப்பட்ட வடிவமாக மாற்றக்கூடிய பல பயனுள்ள கருவிகள் உள்ளன. சில ஸ்கிராப்பிங் கருவிகளை முயற்சிக்கவும், உங்கள் ஸ்கிராப்பிங் தேவைகளுக்கு மிகவும் பொருத்தமான ஒன்றை நீங்கள் நிச்சயமாகக் காண்பீர்கள்.

send email