द्वारा लागू होने वाली समस्याओं के बीच मेंयदि एक प्रोग्रामर नहीं है, तो एक उन्नत उपयोगकर्ता, एक आवेदन से दूसरे डेटा को आयात करना इतना दुर्लभ नहीं है। और अक्सर यह टेबल डेटा आयात करने के लिए आवश्यक है, जिसके लिए, वास्तव में, सीएसवी का प्रारूप का आविष्कार किया गया था। अब कई वैकल्पिक समाधान विकसित किए गए हैं (XML उनमें से हैं) लेकिन कुछ मामलों में एक सीएसवी फाइल बनाना सबसे सुविधाजनक उपाय है, और कुछ - सबसे अधिक समस्याग्रस्त
प्रारूप का नाम अल्पविराम द्वारा अलग किए गए मूल्यों के रूप में समझा गया है। नोटपैड में, फ़ाइल इस तरह दिखती है:
00, 01, 02, 03;
01, 15, 34, 11;
16, 27, 33, 06 (बहुत अंत में यह चिन्ह लगाने के लिए आवश्यक नहीं है)
और एक एक्सेल स्प्रेडशीट या समान अनुप्रयोग में, यह पहले से ही मामला है:
00 | 01 | 02 | 03 |
01 | 15 | 34 | 11 |
16 | 27 | 33 | 06 |
लेकिन अब हमने सरलतम केस का विश्लेषण किया है। समस्याएं ठीक से शुरू होती हैं क्योंकि बहुत संपीड़ित डेटा प्रतिनिधित्व के कारण, सीएसवी प्रारूप का उपयोग बड़ी मात्रा में सूचना के लिए किया जाता है। ज्यादातर अक्सर डेटाबेस में अलग-अलग मान होते हैं: डिजिटल, वर्णानुक्रमिक, वर्णमाला, रिक्त स्थान आदि। अक्सर बड़ी सरणियों में त्रुटियां होती हैं, और यदि, उदाहरण के लिए, कहीं एक फ़ील्ड की सामग्री के भीतर एक अतिरिक्त अल्पविराम दिखाई देता है, तो सभी कोशिकाएं एक को बदल सकती हैं।
सामान्यतया, सीएसवी फ़ाइल स्वरूप के माध्यम से डेटा आयात करते समय उत्पन्न होने वाली समस्या तीन श्रेणियों में विभाजित की जा सकती है:
1 - गलत फ़ील्ड भरना
2 - सीएसवी में फ़ाइल सहेजते समय डेटा का गलत रूपांतरण
3 - आयात कार्यक्रम द्वारा गलत प्रारूप मान्यता।
पहला मामला पहले ही आंशिक रूप से जांच कर चुका है। समस्या का मुकाबला करने के लिए, इनपुट डेटा की शुद्धता को नियंत्रित करने के साधन प्रदान करना आवश्यक है। उदाहरण के लिए, यदि आपको एक मेलिंग सूची के लिए पता डेटाबेस बनाने की आवश्यकता है, तो विशेष स्क्रिप्ट्स की जांच है कि क्या व्यक्ति वांछित प्रारूप में अपना ई-मेल दर्ज कर रहा है या नहीं। जहां रिक्त स्थान, अल्पविराम और कोई अन्य डेटा है जो ग़लत तरीके से पढ़ा जा सकता है, फ़ील्ड की सामग्री उद्धरण अंकों (तथाकथित कंप्यूटर) में संलग्न होना चाहिए।
दूसरा मामला एन्कोडिंग की पसंद से संबंधित है। यह जानना जरूरी है, अक्सर अनुभव से, कार्यक्रम-आयातक क्या एन्कोडिंग पसंद करेंगे विंडोज़ में, 1251 सार्वभौमिक रूप से लागू होता है, इसलिए यदि स्रोत फ़ाइल को यूनिकोड पाठ का सामना करना पड़ता है, तो इसे प्राप्तकर्ता आवेदन में प्रश्नों की एक श्रृंखला के रूप में प्रदर्शित किया जाएगा। एक्सेल में, आप विभिन्न एन्कोडिंग और सीमांकक (उपयोग टैब, और अर्धविराम में बात अभी भी छोड़कर) के साथ सीएसवी प्रारूप में बचा सकता है, लेकिन यह नोटपैड में एक फ़ाइल ++ या OpenOfficeCalc बनाने के लिए सबसे अच्छा है।
तीसरा मामला दूसरा परिणाम है। ऐतिहासिक रूप से, सीएसवी प्रारूप में एक मानक नहीं है। कई कार्यक्रम विशेष रूप से, टीएसवी (टैब-सीमांकित) और एससीएसवी (अर्धविराम) के अलग-अलग दोनों सीएसवी फाइलों को स्वीकार करते हैं, क्योंकि फाइल एक्सटेंशन इस रिपोर्ट की रिपोर्ट नहीं करता है। इस मामले में, डेटा ग़लती से पढ़ा जाता है और वांछित क्रम में कोशिकाओं में वितरित नहीं होता है। सबसे अच्छा सुझाव दिया जा सकता है कि अपने स्वयं के हाथ से एक सीएसवी फ़ाइल बना। जैसा कि पहले ही उल्लेख किया गया है, इसके लिए आपको एक सुविधाजनक संपादक का उपयोग करने की आवश्यकता है।
सीएसवी प्रारूप को कैसे निपटाया जाए, यह जानकारी ज्ञात हैप्रोग्रामर। फ़ाइल बनाने के लिए हमारी सिफारिशों का पालन करने के लिए एक सरल उपयोगकर्ता के लिए यह पर्याप्त है कम से कम समस्या तब होती है जब फ़ाइल विशिष्ट रूप से आयात करने के लिए विशेष रूप से बनाई जाती है (यह किसी अन्य तरीके से भी होती है)। डेटा स्थानांतरण के रूप में उत्पन्न होने वाली सभी संभावित समस्याओं को ध्यान में रखना आसान है।
</ p>>