শীর্ষ প্রশ্ন
সময়রেখা
চ্যাট
প্রসঙ্গ
আন্তর্জাতিক রাসায়নিক শনাক্তকারী
উইকিপিডিয়া থেকে, বিনামূল্যে একটি বিশ্বকোষ
Remove ads
আন্তর্জাতিক রাসায়নিক শনাক্তকারী (ইনচি, উচ্চারণ: /ˈɪntʃiː/ IN-chee)[৩] একটি টেক্সট-ভিত্তিক পরিচায়ক, যা রাসায়নিক পদার্থের জন্য প্রণীত। এটি অণুর গঠনগত তথ্যকে এনকোড করার একটি মানসম্মত পদ্ধতি প্রদান করে এবং তথ্যভাণ্ডার ও ওয়েবের মাধ্যমে এসব তথ্য অনুসন্ধান সহজতর করে। ইনচি ২০০০ থেকে ২০০৫ সালের মধ্যে IUPAC এবং NIST যৌথভাবে উন্নয়ন করে। এর গঠন ও অ্যালগরিদম মালিকানাহীন। ২০০৯ সালের মে মাস থেকে ইনচি ট্রাস্ট নামক যুক্তরাজ্যভিত্তিক অলাভজনক দাতব্য প্রতিষ্ঠান এটি উন্নয়ন ও প্রচারে কাজ করছে।[৪]
ইনচি রাসায়নিক পদার্থের গঠন বর্ণনা করতে বিভিন্ন স্তর ব্যবহার করে। এই স্তরগুলোতে থাকে পরমাণু এবং তাদের পারস্পরিক বন্ধন, টটোমারিক তথ্য, সমস্থানিক উপাত্ত, স্টেরিওরসামিক বৈশিষ্ট্য এবং ইলেকট্রনিক আধান সংক্রান্ত তথ্য।[৫] প্রতিটি স্তর প্রয়োজনে অন্তর্ভুক্ত বা বাদ দেওয়া যায়, যেমন টটোমারিক স্তর প্রাসঙ্গিক না হলে তা এড়িয়ে যাওয়া যেতে পারে। ইনচি অ্যালগরিদম তিনটি ধাপে কাজ করে—প্রথমে 'নরমালাইজেশন' এর মাধ্যমে অপ্রয়োজনীয় তথ্য বাদ দেওয়া হয়, এরপর 'ক্যানোনিকালাইজেশন' এ প্রতিটি পরমাণুকে একটি স্বতন্ত্র নম্বর দেওয়া হয় এবং শেষে 'সিরিয়ালাইজেশন'-এর মাধ্যমে চূড়ান্ত স্ট্রিংটি তৈরি হয়।
ইনচির ব্যবহার CAS রেজিস্ট্রি নম্বর থেকে কয়েকটি দিক দিয়ে আলাদা। ইনচি সম্পূর্ণরূপে উন্মুক্ত ও মালিকানাহীন; এটি অণুর গঠনগত তথ্য থেকে গণনাকৃত হয়, কোনও নির্দিষ্ট কর্তৃপক্ষ কর্তৃক বরাদ্দ করার প্রয়োজন পড়ে না; এবং অভ্যস্ত ব্যবহারকারীরা এর অধিকাংশ তথ্য পাঠযোগ্যভাবে বুঝতে পারেন। ইনচি, IUPAC নামের একটি অত্যন্ত নিয়মতান্ত্রিক সংস্করণ হিসেবে বিবেচিত, যা SMILES এর তুলনায় বেশি তথ্য ধারণ করতে সক্ষম এবং SMILES এর বিপরীতে প্রতিটি গঠনেই একটি একক ইনচি স্ট্রিং নির্ধারিত হয়, যা ডেটাবেসে ব্যবহারের জন্য গুরুত্বপূর্ণ। তবে, ইনচি পরমাণুদের ত্রিমাত্রিক স্থানাঙ্ক সংরক্ষণ করে না; সে উদ্দেশ্যে PDB ফরম্যাট ব্যবহৃত হয়।
ইনচি কি (InChIKey) হল ইনচির সংক্ষিপ্ত, নির্দিষ্ট দৈর্ঘ্যের (২৭ অক্ষর) একটি হ্যাশড রূপ, যা পাঠযোগ্য নয়। ২০০৭ সালের সেপ্টেম্বর মাসে ইনচি কি প্রকাশিত হয়, যাতে পূর্ণ ইনচি স্ট্রিং ওয়েব অনুসন্ধানে অসুবিধা সৃষ্টি না করে।[৬] ইনচি কি সম্পূর্ণরূপে অনন্য নয়, যদিও সংঘর্ষ (collision) বিরল, কিছু উদাহরণ বিদ্যমান।[৭]
২০০৯ সালের জানুয়ারিতে ইনচির ১.০২ সংস্করণ প্রকাশিত হয়, যাতে "স্ট্যান্ডার্ড ইনচি" তৈরি করা যায়। এই সংস্করণে স্টেরিওরসামিক ও টটোমারিক স্তরে ব্যবহারকারীর বিকল্প থাকেনা। স্ট্যান্ডার্ড ইনচি থেকে স্ট্যান্ডার্ড ইনচি কি তৈরি করা যায়, যা বিভিন্ন উৎস থেকে প্রাপ্ত ইনচি তুলনা ও যাচাই সহজ করে।
২০১০ সাল থেকে ইনচির মান ও সফটওয়্যারের উন্নয়ন কাজটি পরিচালনা করছে অলাভজনক ইনচি ট্রাস্ট। ২০২০ সালের ডিসেম্বরে ইনচির ১.০৬ সংস্করণ প্রকাশিত হয়।[৮] ১.০৪ সংস্করণের আগ পর্যন্ত এই সফটওয়্যার ওপেন সোর্স LGPL লাইসেন্সে মুক্ত ছিল।[৯] পরবর্তী ১.০৫ ও ১.০৬ সংস্করণে 'IUPAC-InChI Trust License' ব্যবহৃত হয়।[১০]
বর্তমান সফটওয়্যারের সংস্করণ ১.০৭.১ (আগস্ট ২০২৪), যা MIT লাইসেন্সে মুক্ত এবং ইনচির গিটহাব সাইট থেকে ডাউনলোড করা যায়।
Remove ads
প্রজন্ম
সারাংশ
প্রসঙ্গ
টটোমেরিক গঠনের জন্য ভিন্ন ইনচি উৎপন্ন হওয়া এড়াতে, ইনচি তৈরি করার আগে একটি রাসায়নিক গঠনকে স্বাভাবিকীকরণ (normalization) প্রক্রিয়ার মাধ্যমে তথাকথিত মূল অভিভাবক (core parent) গঠনে রূপান্তর করা হয়। এই প্রক্রিয়ায় বন্ধন ক্রম (bond order) পরিবর্তন, আনুষ্ঠানিক আধান (formal charge) পুনর্বিন্যাস এবং প্রোটন (হাইড্রোজেন আয়ন) যোগ বা বিয়োগ করা হতে পারে। বিভিন্ন ইনপুট গঠন থেকেও একই ফলাফল পাওয়া সম্ভব; যেমন, অ্যাসেটিক অ্যাসিড এবং অ্যাসিটেট উভয়ই অ্যাসেটিক অ্যাসিডের অভিভাবক গঠন দেবে। একটি অভিভাবক গঠন বিচ্ছিন্নও হতে পারে, অর্থাৎ একাধিক উপাদানে গঠিত থাকতে পারে। সেক্ষেত্রে ইনচির উপস্তরগুলো (sublayers) সাধারণত প্রতিটি উপাদানের জন্য পৃথক উপস্তর ধারণ করে, যা সেমিকোলন (;) দ্বারা আলাদা থাকে (রাসায়নিক সংকেত উপস্তরে ডট (.) ব্যবহৃত হয়)। এর একটি উদাহরণ হলো, স্বাভাবিকীকরণ চলাকালে সমস্ত ধাতব পরমাণু বিচ্ছিন্ন হয়ে যায়; যেমন, টেট্রাইথিলসীসা (tetraethyllead)-র ইনচিতে পাঁচটি উপাদান থাকবে—একটি সীসার জন্য এবং চারটি ইথিল গ্রুপের জন্য।[৫]
ইনচির প্রথম ও প্রধান স্তরটি এই অভিভাবক গঠনের জন্য বরাদ্দ, যেখানে তার রাসায়নিক সংকেত, হাইড্রোজেনবিহীন সংযোগ (যার জন্য /c
উপস্তর ব্যবহৃত হয়) এবং হাইড্রোজেন সংযোগ (/h
উপস্তর) বর্ণিত থাকে। চার্জ স্তরের /q
অংশে গঠনের মোট আধান এবং /p
অংশে কতটি প্রোটন যোগ বা বিয়োগ করলে মূল গঠন পুনরুদ্ধার করা যাবে তা উল্লেখ থাকে। যদি উপস্থিত থাকে, তবে স্টেরিওরসামিক স্তরে /b
, /t
, /m
ও /s
উপস্তরসমূহের মাধ্যমে স্টেরিওরসামিক তথ্য প্রদান করা হয়, এবং সমস্থানিক স্তর /i
তে (যার মধ্যে /h
, /b
, /t
, /m
ও /s
উপস্তর থাকতে পারে) সমস্থানিক তথ্য বর্ণিত হয়। শুধুমাত্র এই স্তরসমূহই স্ট্যান্ডার্ড ইনচিতে অন্তর্ভুক্ত হতে পারে।[৫]
যদি ব্যবহারকারী নির্দিষ্ট একটি টটোমার উপস্থাপন করতে চান, তবে একটি নির্দিষ্ট হাইড্রোজেন স্তর (/f
) সংযুক্ত করা যায়, যাতে আরও বিভিন্ন উপস্তর থাকতে পারে। তবে এটি স্ট্যান্ডার্ড ইনচিতে প্রযোজ্য নয়, তাই বিভিন্ন টটোমার একই স্ট্যান্ডার্ড ইনচি দেবে (উদাহরণস্বরূপ, অ্যালানিন নিউট্রাল কিংবা জুইটার আয়নিক যে কোনো রূপে ইনপুট দিলেও একই স্ট্যান্ডার্ড ইনচি দেবে)। সর্বশেষে, একটি অ-মানক (nonstandard) পুনঃসংযুক্ত স্তর /r
যুক্ত করা যায়, যা ধাতব পরমাণুর সঙ্গে বন্ধন ভাঙ্গা ছাড়াই তৈরি নতুন ইনচি উপস্থাপন করে। এতে /f
সহ বিভিন্ন উপস্তর থাকতে পারে।[৫]
Remove ads
বিন্যাস ও স্তরসমূহ
সারাংশ
প্রসঙ্গ
প্রতিটি ইনচি স্ট্রিং "InChI=
" দিয়ে শুরু হয়, যার পরে সংস্করণ নম্বর থাকে, বর্তমানে সেটি 1
। যদি ইনচি স্ট্যান্ডার্ড হয়, তবে এর পর S
অক্ষর যুক্ত হয়, যা সম্পূর্ণরূপে মানানুগ স্ট্যান্ডার্ড ইনচিকে নির্দেশ করে। এই ধরনের ইনচিতে অণুর গঠনগত সূক্ষ্মতা ও অঙ্কনের ব্যাখ্যাগত নিয়মাবলি সমানভাবে বজায় রাখা হয়। ইনচির পরবর্তী অংশ বিভিন্ন স্তর ও উপস্তরে বিভক্ত, যেখানে প্রতিটি স্তর একটি নির্দিষ্ট ধরনের তথ্য বহন করে। স্তর ও উপস্তরসমূহ "/
" দ্বারা পৃথক হয় এবং অধিকাংশ ক্ষেত্রে একটি নির্দিষ্ট প্রিফিক্স অক্ষর দ্বারা শুরু হয় (প্রধান স্তরের রাসায়নিক সংকেত উপস্তর ছাড়া)।
ইনচিতে ছয়টি প্রধান স্তর থাকে, যেগুলোর কিছু গুরুত্বপূর্ণ উপস্তর রয়েছে:
- প্রধান স্তর (সবসময় উপস্থিত থাকে)
- রাসায়নিক সংকেত (প্রিফিক্স নেই): এটি একমাত্র উপস্তর যা প্রতিটি ইনচিতে থাকতে হয়। ইনচির সংখ্যাগুলি সংকেত অনুযায়ী মৌলগুলোর ক্রমানুসারে দেয়া হয়, হাইড্রোজেন বাদ দিয়ে। যেমন, "/C10H16N5O13P3" অর্থাৎ পরমাণু ১–১০ হলো কার্বন, ১১–১৫ নাইট্রোজেন, ১৬–২৮ অক্সিজেন, এবং ২৯–৩১ ফসফরাস।[১১]
- পরমাণু সংযোগ (প্রিফিক্স: "
c
"): হাইড্রোজেন বাদে সংকেত অনুযায়ী ক্রমিকভাবে পরমাণুগুলোর নম্বর দেওয়া হয় এবং এই উপস্তরটি নির্দেশ করে কোন পরমাণু কোনটির সঙ্গে বন্ধনে আবদ্ধ। - হাইড্রোজেন (প্রিফিক্স: "
h
"): প্রতিটি পরমাণুর সঙ্গে কতটি হাইড্রোজেন যুক্ত আছে তা এখানে বর্ণিত হয়।
- আধান স্তর
- চার্জ উপস্তর (প্রিফিক্স: "
q
") - প্রোটন উপস্তর (প্রিফিক্স: "
p
") — গঠনে কতটি প্রোটন যোগ বা বিয়োগ করতে হবে তা নির্দেশ করে।
- চার্জ উপস্তর (প্রিফিক্স: "
- স্টেরিওরসামিক স্তর
- দ্বি-বন্ধন ও কিউমুলিন (প্রিফিক্স: "
b
") - টেট্রাহেড্রাল স্টেরিওরসামিকতা এবং এলিন (প্রিফিক্স: "
t
", "m
") - স্টেরিওরসামিক তথ্যের ধরন (প্রিফিক্স: "
s
")
- দ্বি-বন্ধন ও কিউমুলিন (প্রিফিক্স: "
- সমস্থানিক স্তর (প্রিফিক্স: "
i
") — এতে থাকতে পারে:- সমস্থানিক হাইড্রোজেনের জন্য "
h
" উপস্তর - স্টেরিওরসামিক সমস্থানিক তথ্যের জন্য "
b
", "t
", "m
", "s
" উপস্তর
- সমস্থানিক হাইড্রোজেনের জন্য "
- নির্দিষ্ট হাইড্রোজেন স্তর (প্রিফিক্স: "
f
") — টটোমেরিক হাইড্রোজেনের জন্য ব্যবহৃত হয়; এতে উপরিউক্ত কিছু বা সব স্তর থাকতে পারে, তবে পরমাণু সংযোগ বাদ দেওয়া হয়। এটি কখনোই স্ট্যান্ডার্ড ইনচিতে অন্তর্ভুক্ত হয় না।[১১]
- পুনঃসংযুক্ত স্তর (প্রিফিক্স: "
r
") — এটি এমন গঠনের ইনচি ধারণ করে যেখানে ধাতব পরমাণু পুনঃসংযুক্ত থাকে; এটি স্ট্যান্ডার্ড ইনচিতে অন্তর্ভুক্ত হয় না।
এই ডিলিমিটার-প্রিফিক্সযুক্ত বিন্যাসের সুবিধা হলো, ব্যবহারকারীরা চাইলে নির্দিষ্ট স্তরের সঙ্গে মিলে যায় এমন ইনচি শনাক্তকারীগুলোর জন্য ওয়াইল্ডকার্ড অনুসন্ধান করতে পারেন।
Remove ads
ইনচি কি
সারাংশ
প্রসঙ্গ
সংক্ষিপ্ত, ২৭ অক্ষরের ইনচি কি হলো পূর্ণ ইনচির একটি হ্যাশড সংস্করণ, যা SHA-256 অ্যালগরিদম ব্যবহার করে তৈরি করা হয়। এটি রাসায়নিক যৌগগুলিকে ওয়েবের মাধ্যমে সহজে অনুসন্ধানের সুবিধা দেওয়ার উদ্দেশ্যে তৈরি করা হয়েছে।[৬] স্ট্যান্ডার্ড ইনচি কি হলো স্ট্যান্ডার্ড ইনচির হ্যাশড রূপ। ২০০৭ সালের আগ পর্যন্ত অধিকাংশ রাসায়নিক গঠন ইন্টারনেটে GIF ফাইল আকারে উপস্থাপিত হতো, যা রাসায়নিক উপাদানের ভিত্তিতে অনুসন্ধানযোগ্য ছিল না। পূর্ণ ইনচি স্ট্রিং অনেক বড় হওয়ায় সহজ অনুসন্ধানে তা ব্যবহার উপযোগী ছিল না; এজন্য ইনচি কি তৈরি করা হয়।
যদিও দুটি ভিন্ন অণুর জন্য একি ইনচি কি তৈরি হওয়ার সম্ভাবনা খুবই ক্ষুদ্র, তবুও এটি একেবারে শূন্য নয়। শুধু প্রথম ১৪ অক্ষরের ক্ষেত্রে হ্যাশ সংঘর্ষের সম্ভাবনা প্রতি একশ’ কোটির ভিন্ন গঠনের ৭৫টি ডেটাবেসে একটি সংঘর্ষ হওয়ার সম্ভাবনা হিসাব করা হয়েছে। বর্তমানে যেহেতু কোনো ডেটাবেসে ৫ কোটির বেশি গঠন নেই, তাই এই সংঘর্ষের সম্ভাবনা কার্যত ন্যূনতম। সাম্প্রতিক এক গবেষণায় এই সংঘর্ষের হার পরীক্ষামূলকভাবে বিশ্লেষণ করা হয়েছে এবং দেখা গেছে তা তাত্ত্বিক পূর্বানুমানের সঙ্গেই সঙ্গতিপূর্ণ।[১২]
বর্তমানে একটি ইনচি কি তিনটি ভাগে বিভক্ত থাকে, যা হাইফেন দ্বারা পৃথক হয়: যথাক্রমে ১৪, ১০ ও ১ অক্ষর—যেমন: XXXXXXXXXXXXXX-YYYYYYYYFV-P
। প্রথম ১৪ অক্ষর ইনচির সংযুক্তি সংক্রান্ত তথ্য (প্রধান স্তর ও চার্জ স্তরের /q
উপস্তর) থেকে SHA-256 হ্যাশের মাধ্যমে তৈরি হয়। দ্বিতীয় অংশে থাকে ৮ অক্ষরের হ্যাশ, যা ইনচির বাকি স্তর থেকে তৈরি হয়; এরপর একটি অক্ষর যা ইনচি কি-এর ধরন নির্দেশ করে (S
মানে স্ট্যান্ডার্ড, N
মানে নন-স্ট্যান্ডার্ড), এবং একটি অক্ষর যা ইনচির সংস্করণ নির্দেশ করে (বর্তমানে A
মানে সংস্করণ ১)। সর্বশেষ এক অক্ষর ইনচির অভিভাবক গঠনের প্রোটোনেশন নির্দেশ করে, যা চার্জ স্তরের /p
উপস্তরের সঙ্গে সম্পর্কযুক্ত—যেমন N
মানে প্রোটোন সংযোজন নেই, O
, P
ইত্যাদি মানে প্রোটোন যুক্ত করতে হবে এবং M
, L
ইত্যাদি মানে প্রোটোন অপসারণ করতে হবে।[১৩][৫]
উদাহরণ

মরফিন-এর গঠন ডানদিকে দেখানো হয়েছে। মরফিনের স্ট্যান্ডার্ড ইনচি হলো:
InChI=1S/C17H19NO3/c1-18-7-6-17-10-3-5-13(20)16(17)21-15-12(19)4-2-9(14(15)17)8-11(10)18/h2-5,10-11,13,16,19-20H,6-8H2,1H3/t10-,11+,13-,16-,17-/m0/s1
এবং স্ট্যান্ডার্ড ইনচি কি হলো:
BQJCRHHNABKAKU-KBQPJGBKSA-N
।[১৪]
ইনচি রিজলভার
যেহেতু ইনচি কি থেকে পূর্ণ ইনচি পুনর্গঠন করা যায় না, তাই ইনচি কি দ্বারা মূল গঠন জানতে সর্বদা ইনচির সঙ্গে একটি লিংকের প্রয়োজন হয়। এই কাজের জন্য ইনচি রিজলভার ব্যবহৃত হয়, যা ইনচি ও ইনচি কি-এর মধ্যে সম্পর্ক স্থাপন করে। এর প্রোটোটাইপ পরিষেবা প্রদান করছে ন্যাশনাল ক্যান্সার ইনস্টিটিউট, ইবিআই এর ইউনিকেম পরিষেবা এবং PubChem। ChemSpider-এও একটি রিজলভার ছিল, যা জুলাই ২০১৫-তে বন্ধ করা হয়।[১৫]
Remove ads
নাম
এই ফরম্যাটটি প্রথমে "IChI" (IUPAC Chemical Identifier) নামে পরিচিত ছিল। ২০০৪ সালের জুলাই মাসে এর নাম পরিবর্তন করে রাখা হয় "INChI" (IUPAC-NIST Chemical Identifier)। পরবর্তীতে ২০০৪ সালের নভেম্বর মাসে আবার নাম পরিবর্তন করে রাখা হয় "InChI" (IUPAC International Chemical Identifier)। এটি IUPAC-এর একটি ট্রেডমার্ক।
চলমান উন্নয়ন
ইনচি মানদণ্ডের বৈজ্ঞানিক দিকনির্দেশনা প্রদান করে IUPAC-এর অষ্টম বিভাগের উপকমিটি (Division VIII Subcommittee)। মান সম্প্রসারণ সংক্রান্ত বিভিন্ন উপ-গোষ্ঠীর গবেষণা ও সংজ্ঞায়নের জন্য অর্থায়ন করে IUPAC এবং ইনচি ট্রাস্ট উভয়ই। ইনচি ট্রাস্ট ইনচির উন্নয়ন, পরীক্ষণ এবং নথিকরণে অর্থ সহায়তা প্রদান করে। বর্তমানে যেসব সম্প্রসারণ সংজ্ঞায়িত করা হচ্ছে, তা পলিমার, মিশ্রণ, মার্কুশ গঠন, প্রতিক্রিয়া[১৬] এবং অর্গানোমেটালিক যৌগের জন্য প্রণীত। এগুলিকে যখন IUPAC-এর Division VIII উপকমিটি অনুমোদন করবে, তখন এগুলো ইনচি অ্যালগরিদমে যুক্ত হবে।
Remove ads
সফটওয়্যার
সারাংশ
প্রসঙ্গ
ইনচি ট্রাস্ট ইনচি, ইনচি কি এবং অন্যান্য শনাক্তকারী তৈরি করার জন্য সফটওয়্যার উন্নয়ন করেছে। এই সফটওয়্যারের প্রকাশ ইতিহাস নিচে উপস্থাপন করা হলো।[১৭]
Remove ads
গ্রহণযোগ্যতা
বৃহৎ ও ক্ষুদ্র অনেক ডেটাবেসই ইনচিকে গ্রহণ করেছে, যেমন ChemSpider, ChEMBL, Golm Metabolome Database এবং PubChem।[১৮] তবে এই গ্রহণ প্রক্রিয়া সবসময় সরল নয় এবং অনেক ডেটাবেসে রাসায়নিক গঠন ও ইনচির মধ্যে অসঙ্গতি দেখা যায়, যা বিভিন্ন ডেটাবেসের সংযোগ বা লিংকিংয়ে সমস্যা সৃষ্টি করে।[১৯]
আরও দেখুন
- Molecular Query Language
- Simplified molecular-input line-entry system (SMILES)
- Molecule editor
- SYBYL Line Notation
- Bioclipse — আঁকা গঠন বা খোলা ফাইল থেকে ইনচি ও ইনচি কি তৈরি করতে পারে
- Chemistry Development Kit — JNI-InChI ব্যবহার করে ইনচি তৈরি, ইনচি থেকে গঠন পুনর্গঠন এবং ইনচি অ্যালগরিদমের ভিত্তিতে টটোমার উৎপন্ন করতে সক্ষম
টীকা ও তথ্যসূত্র
বহিঃসংযোগ
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads