लोगो
यूनियनपीडिया
संचार
Google Play पर पाएं
नई! अपने एंड्रॉयड डिवाइस पर डाउनलोड यूनियनपीडिया!
मुक्त
ब्राउज़र की तुलना में तेजी से पहुँच!
 

कॉर्पस भाषाविज्ञान

सूची कॉर्पस भाषाविज्ञान

भाषाशास्त्र में वृहद एवं सुसंगठित पाठ (टेक्स्ट) को पाठसंग्रह या कॉर्पस (corpus) कहते हैं। आज के एलेक्ट्रानिक युग में पाठसंग्रह को एलेक्ट्रानिक प्रारूप में संग्रहित किया जाता है एवं संगणक द्वारा इसकी बहुविध जाँच-पड़ताल एवं प्रसंस्करण किया जाता है। इस प्रकार का पाठसंग्रह सांख्यिकीय विश्लेषण करने, परिकल्पना-परीक्षण, शब्दों के प्रयोग की आवृत्ति निकालने तथा भाषायी नियमों की जाँच के लिये प्रयुक्त होते हैं। .

6 संबंधों: पाठसंग्रह, बारंबारता के अनुसार शब्द सूची, भाषाविज्ञान, सुसंगतता, कंप्यूटर, अनुवाद स्मृति

पाठसंग्रह

भाषाविज्ञान में बड़े और संरचित (structured) पाठ के समुच्चय को पाठसंग्रह या कॉर्पस (corpus) कहते हैं। पाठसंग्रह के बहुत से उपयोग हैं। जैसे किसी भाषा में प्रयुक्त शब्दों की बारंबारता निकालना, किसी भाषा में प्रयुक्त सर्वाधिक १००० शब्दों की जानकारी निकालना, कोई शब्द किस-किस प्रकार से प्रयुक्त होता है आदि। .

नई!!: कॉर्पस भाषाविज्ञान और पाठसंग्रह · और देखें »

बारंबारता के अनुसार शब्द सूची

बारंबारता के अनुसार शब्द सूची से आशय किसी भाषा के किसी ग्रन्थसंग्रह (कॉर्पस) में आये हुए शब्दों को उनकी बारम्बारता के अनुसार क्रमबद्ध करने से है। इस तरह की शब्द-सूची उस भाषा की शब्दावली सीखने के लिये अत्यन्त उपयोगी होती है क्योंकि अधिक प्रयोग किये जाने वाले शब्दों को पहले सीखने से बहुत कम शब्द सीखकर भी काम चलाने लायक योग्यता प्राप्त हो जाती है। उदाहरण के लिये हिन्दी के सर्वाधिक प्रयुक्त २० शब्दों की सूची कुछ इस प्रकार है- .

नई!!: कॉर्पस भाषाविज्ञान और बारंबारता के अनुसार शब्द सूची · और देखें »

भाषाविज्ञान

भाषाविज्ञान भाषा के अध्ययन की वह शाखा है जिसमें भाषा की उत्पत्ति, स्वरूप, विकास आदि का वैज्ञानिक एवं विश्लेषणात्मक अध्ययन किया जाता है। भाषा विज्ञान के अध्ययेता 'भाषाविज्ञानी' कहलाते हैं। भाषाविज्ञान, व्याकरण से भिन्न है। व्याकरण में किसी भाषा का कार्यात्मक अध्ययन (functional description) किया जाता है जबकि भाषाविज्ञानी इसके आगे जाकर भाषा का अत्यन्त व्यापक अध्ययन करता है। अध्ययन के अनेक विषयों में से आजकल भाषा-विज्ञान को विशेष महत्त्व दिया जा रहा है। .

नई!!: कॉर्पस भाषाविज्ञान और भाषाविज्ञान · और देखें »

सुसंगतता

किसी ग्रन्थ या किसी अन्य कृति में आये हुए प्रमुख शब्दों को वर्णक्रम में या किसी अन्य क्रम में सजाकर निर्मित सूची को सुसंगतता या कॉन्कॉर्डैंस (concordance) कहते हैं। कम्यूटर प्रोग्रामों के आ जाने से यह काम अपेक्षाकृत बहुत सरल हो गया है किन्तु इसके पहले बहुत महत्वपूर्ण कृतियों (जैसे वेद, बाइबल, कुरान, शेक्सपीयर की कृतियाँ आदि) के ही सुसंगतता निर्मित किये जा सके थे क्योंकि इसमें समय और खर्च बहुत लगता था और काम बहुत कठिन था। विश्व की पहली सुसंगतता 'वल्गेट बाइबल' (Vulgate Bible) की बनी थी जिसे सन्त चर के हग (Hugh of St Cher) (मृत्यु 1262) ने ५०० भिक्षुओं की सहायता से संकलित किया था। सन् 1448 में रब्बी मॉर्डेकाई नाथन (Rabbi Mordecai Nathan) ने हिब्रू भाषा की बाइबल की सुसंगतता बनायी जिसे बनाने में दस वर्ष लगे। .

नई!!: कॉर्पस भाषाविज्ञान और सुसंगतता · और देखें »

कंप्यूटर

निजी संगणक कंप्यूटर (अन्य नाम - संगणक, कंप्यूटर, परिकलक) वस्तुतः एक अभिकलक यंत्र (programmable machine) है जो दिये गये गणितीय तथा तार्किक संक्रियाओं को क्रम से स्वचालित रूप से करने में सक्षम है। इसे अंक गणितीय, तार्किक क्रियाओं व अन्य विभिन्न प्रकार की गणनाओं को सटीकता से पूर्ण करने के लिए योजनाबद्ध तरीके से निर्देशित किया जा सकता है। चूंकि किसी भी कार्य योजना को पूर्ण करने के लिए निर्देशो का क्रम बदला जा सकता है इसलिए संगणक एक से ज्यादा तरह की कार्यवाही को अंजाम दे सकता है। इस निर्देशन को ही कम्प्यूटर प्रोग्रामिंग कहते है और संगणक कम्प्यूटर प्रोग्रामिंग भाषा की मदद से उपयोगकर्ता के निर्देशो को समझता है। यांत्रिक संगणक कई सदियों से मौजूद थे किंतु आजकल अभिकलित्र से आशय मुख्यतः बीसवीं सदी के मध्य में विकसित हुए विद्दुत चालित अभिकलित्र से है। तब से अबतक यह आकार में क्रमशः छोटा और संक्रिया की दृष्टि से अत्यधिक समर्थ होता गया हैं। अब अभिकलक घड़ी के अन्दर समा सकते हैं और विद्युत कोष (बैटरी) से चलाये जा सकते हैं। निजी अभिकलक के विभिन्न रूप जैसे कि सुवाह्य संगणक, टैबलेट आदि रोजमर्रा की जरूरत बन गए हैं। परंपरागत संगणकों में एक केंद्रीय संचालन इकाई (सीपीयू) और सूचना भन्डारण के लिए स्मृति होती है। संचालन इकाई अंकगणित व तार्किक गणनाओ को अंजाम देती है और एक अनुक्रमण व नियंत्रण इकाई स्मृति में रखे निर्देशो के आधार पर संचालन का क्रम बदल सकती है। परिधीय या सतह पे लगे उपकरण किसी बाहरी स्रोत से सूचना ले सकते है व कार्यवाही के फल को स्मृति में सुरक्षित रख सकते है व जरूरत पड़ने पर पुन: प्राप्त कर सकते हैं। एकीकृत परिपथ पर आधारित आधुनिक संगणक पुराने जमाने के संगणकों के मुकबले करोड़ो अरबो गुना ज्यादा समर्थ है और बहुत ही कम जगह लेते है। सामान्य संगणक इतने छोटे होते है कि मोबाइल फ़ोन में भी समा सकते है और मोबाइल संगणक एक छोटी सी विद्युत कोष (बैटरी) से मिली ऊर्जा से भी काम कर सकते है। ज्यादातर लोग “संगणकों” के बारे में यही राय रखते है कि अपने विभिन्न स्वरूपों में व्यक्तिगत संगणक सूचना प्रौद्योगिकी युग के नायक है। हालाँकि embedded system|सन्निहित संगणक जो कि ज्यादातर उपकरणों जैसे कि आंकिक श्रव्य वादक|एम.पी.३ वादक, वायुयान व खिलौनो से लेकर औद्योगिक मानव यन्त्र में पाये जाते है लोगो के बीच ज्यादा प्रचलित है। .

नई!!: कॉर्पस भाषाविज्ञान और कंप्यूटर · और देखें »

अनुवाद स्मृति

अनुवाद स्मृति (translation memory, or TM) एक डेटाबेस है जिसमें स्रोत भाषा के किसी खण्ड (वाक्यांश, वाक्य, मुहावरा, अनुच्छेद आदि) के संगत लक्ष्य भाषा का खण्ड भण्डारित रहता है। स्रोत भाषा एवं लक्ष्य भाषा के ये युग्म पहले से मानव अनुवादकों द्वारा तैयार किये गये होते हैं। अनुवाद स्मृति में शब्द और उसका अनुवाद नहीं भण्डारित किया जाता बल्कि ये अनुवाद शब्दावली में दिये गये होते हैं। अनुवाद-स्मृति का उपयोग मानव अनुवादकों की सहायता करने के लिये किया जाता है। अनुवाद-स्मृति का प्रयोग आमतौर पर कम्प्यूटर सहायित अनुवाद (CAT), शब्द संसाधक प्रोग्रामों, शब्दावली-प्रबन्धन प्रणालियों, बहुभाषी शब्दकोशों तथा 'कच्चे' मशीनी अनुवाद के साथ मिलकर किया जाता है (न कि अकेले)।;उदाहरण अनुवाद-स्मृति में "Don't loose temper" के लिये "क्रोधित मत हो" तथा "Do come tomorrow" के लिये "कल जरूर आना" संचित किया जा सकता है। किसी बड़े टेक्स्ट (पाठ) का अनुवाद करते समय मशीन देखती है कि इसका कोई अंश (या उससे मिलता-जुलता खण्ड) अनुवाद-स्मृति में मौजूद है या नहीं। यदि है तो यह स्मृति से ले लिया जाता है और माना जाता है कि अनुवाद शत-प्रतिशत शुद्ध हो गया। जो खण्ड स्मृति में नहीं पाये जाते उन्हें अन्य विधि का सहारा लेते हुए अनुवाद किया जाता है। वे प्रोग्राम जो 'अनुवाद स्मृति' फाइल के निर्माण, उसको व्यवस्थित करने, उसमें नये अनुवाद-युग्म जोडने, अनुवाद-युग्म हटाने, एक प्रकार की अनुवाद-स्मृति फाइल को दूसरे प्रकार में बदलने आदि का कार्य करते हैं उन्हें अनुवाद स्मृति प्रबन्धक (translation memory managers या TMM) कहते हैं। .

नई!!: कॉर्पस भाषाविज्ञान और अनुवाद स्मृति · और देखें »

यहां पुनर्निर्देश करता है:

पाठसंग्रह भाषाविज्ञान, कॉर्पस

निवर्तमानआने वाली
अरे! अब हम फेसबुक पर हैं! »