ಪಿಕ್ಸೆಲ್ಗಳಿಂದ ಗ್ರಹಿಕೆಗೆ — ಹೇಗೆ ಮಾಪನೀಯ 3D ಸೆನ್ಸರ್ ಫ್ಯೂಷನ್ ಲೇಬಲಿಂಗ್ ಮುಂದಿನ ಶಾರೀರಿಕ AI ತರಂಗವನ್ನು ಶಕ್ತಿಮಾಡುತ್ತದೆ
ಭೌತಿಕ ಬುದ್ಧಿಮತ್ತೆಯ ಹಿಂದೆ ಇರುವ ಡೇಟಾ
ಕಾರ್ಖಾನೆ ನೆಲವನ್ನು ಸಂಚರಿಸುವ ಪ್ರತಿಯೊಂದು ರೋಬೋಟ್, ಪಾದಚಾರಿ ವ್ಯಕ್ತಿಯನ್ನು ಪತ್ತೆಹಚ್ಚುವ ಪ್ರತಿಯೊಂದು ಸ್ವಯಂಚಾಲಿತ ವಾಹನ, ಮತ್ತು ಚಲಿಸುವ ಗುರಿಯ ಮೇಲೆ ಇಳಿಯುವ ಪ್ರತಿಯೊಂದು ಡ್ರೋನ್—all ಒಂದೇ ವಿಷಯದ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿವೆ: ಉನ್ನತ-ಮಟ್ಟದ ಲೇಬಲ್ ಮಾಡಿದ ಡೇಟಾ. ಆದರೆ ಭೌತಿಕ AI ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾಗುತ್ತಾ ಹೋದಂತೆ, ಅದರ ಡೇಟಾ ಪೈಪ್ಲೈನ್ ಕೂಡ ಹಾಗೆಯೇ ಸಂಕೀರ್ಣವಾಗುತ್ತದೆ. ರೋಬೋಟಿಕ್ಸ್ ಮತ್ತು ಸ್ವಯಂಚಾಲಿತ ವ್ಯವಸ್ಥೆಗಳು ಕ್ಯಾಮೆರಾ, ಲೈಡಾರ್, ರಾಡಾರ್, IMU ಮತ್ತು GPS ಸೆನ್ಸರ್ಗಳಿಂದ—ಅಧಿಕವಾಗಿ ರಿಯಲ್ ಟೈಮ್ನಲ್ಲಿ—ಬರುವ ಇನ್ಪುಟ್ಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬೇಕಾಗುತ ್ತದೆ. ಇದಕ್ಕಾಗಿಯೇ 3D ಸೆನ್ಸರ್ ಫ್ಯೂಷನ್ ಲೇಬಲಿಂಗ್ ಅತ್ಯಂತ ಅವಶ್ಯಕವಾಗುತ್ತದೆ.
ಭೌತಿಕ AI ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ ಗ್ರಹಿಕೆಯ ಸವಾಲು
ಆಧುನಿಕ ಭೌತಿಕ AI ವ್ಯವಸ್ಥೆಗಳು ಬಹು-ಮೋಡಲ್ ಗ್ರಹಿಕೆಯನ್ನು ಅವಲಂಬಿಸಿವೆ — ನೋಡುವುದು, ಸಂವೇದನೆ ಮಾಡುವುದು ಮತ್ತು ಅವುಗಳ ಪರಿಸರವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು. ಆದರೆ ಅವು ಸೆರೆಹಿಡಿಯುವ ಕಚ್ಚಾ ಡೇಟಾ ಅಸ್ತವ್ಯಸ್ತವಾಗಿದೆ:
- ಪ್ರತಿ ಫ್ರೇಮ್ಗೆ ಲಕ್ಷಾಂತರ ಪಾಯಿಂಟ್ಗಳಿರುವ ಲಿಡಾರ್ ಪಾಯಿಂಟ್ ಕ್ಲೌಡ್ಗಳು.
- ಆಕಾರವನ್ನು ಅಲ್ಲದೆ ಆಳ ಮತ್ತು ವೇಗವನ್ನು ಸೆರೆಹಿಡಿಯುವ ರಾಡಾರ್ ರಿಟರ್ನ್ಗಳು.
- RGB ಅಥವಾ ಇನ್ಫ್ರಾರೆಡ್ ಕ್ಯಾಮೆರಾಗಳಿಂದ ವೀಡಿಯೊ ಸ್ಟ್ರೀಮ್ಗಳು.
- ಕಾಲಾತೀತ ಹೊಂದಾಣಿಕೆಗೆ ಅಗತ್ಯವಿರುವ ಇನರ್ಷಿಯಲ್ ಮತ್ತು GPS ಸಿಗ್ನಲ್ಗಳು.
ಈ ಸ್ಟ್ರೀಮ್ಗಳನ್ನು ಒಂದೇ ಡೇಟಾಸೆಟ್ಗೆ ಒಗ್ಗೂಡಿಸಲು ಫ್ಯೂಷನ್ ಪೈಪ್ಲೈನ್ ಮತ್ತು 3D ಜ್ಯಾಮಿತಿ, ಸಂಯೋಜಿತ ಫ್ರೇಮ್ಗಳು ಮತ್ತು ಸೆನ್ಸರ್ ಕ್ಯಾಲಿಬ್ರೇಷನ್ನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ಕಾರ್ಮಿಕ ಶಕ್ತಿಯ ಅಗತ್ಯವಿದೆ. ಪರಂಪರাগত 2D ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ ಲೇಬಲಿಂಗ್ ಸಾಕಾಗುವುದಿಲ್ಲ.
ಏಕೆ 3D ಡೇಟಾ ಲೇಬಲಿಂಗ್ ಇಷ್ಟು ಸಂಕೀರ್ಣವಾಗಿದೆ — ಮತ್ತು ಇಷ್ಟು ಖರ್ಚು ಆಗುತ್ತದೆ
3D ಡೇಟಾವನ್ನು ಲೇಬಲ್ ಮಾಡಲು ವಿಶೇಷ ಸಾಧನಗಳು ಮತ್ತು ಪರಿಣತಿ ಅಗತ್ಯವಿದೆ:
- 3D ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ಗಳು ಮತ್ತು ಸೆಮ್ಯಾಂಟಿಕ್ ಸೆಗ್ಮೆಂಟೇಶನ್ಗಳು ಸೆನ್ಸರ್ ಕ್ಯಾಲಿಬ್ರೇಶನ್ ಮ್ಯಾಟ್ರಿಕ್ಸ್ಗಳೊಂದಿಗೆ ನಿಖರವಾಗಿ ಹೊಂದಿಕೊಳ್ಳಬೇಕು.
- ಬಹು ಸೆನ್ಸರ್ಗಳಾದ್ಯಂತ ಸಮಯ ಸಿಂಕ್ರೊನೈಜೇಶನ್ ಫ್ರೇಮ್ಗಳು ಅದೇ ಕ್ಷಣವನ್ನು ಪ್ರತಿನಿಧಿಸುವಂತೆ ಮಾಡುತ್ತದೆ.
- ಒಕ್ಲೂಷನ್ ಹ್ಯಾಂಡ್ಲಿಂಗ್ ಮತ್ತು ಮಲ್ಟಿ-ಫ್ರೇಮ್ ಟ್ರ್ಯಾಕಿಂಗ್** ಒಂದು ವಸ್ತು ಮರುಪ್ರವೇಶಿಸುತ್ತದೆ ಅಥವಾ ದೃಷ್ಟಿಯಿಂದ ಹೊರಗೆ ಹೋಗುತ್ತದೆ ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸುತ್ತದೆ.
- ಅನೋಟೇಶನ್ ಸಮ್ಮತತೆ ಮತ್ತು ಇಂಟರ್-ಅನೋಟೇಟರ್ ಒಪ್ಪಂದ (IAA) ನೇರವಾಗಿ ಮಾದರಿ ಕಾರ್ಯಕ್ಷಮತಿಯನ್ನು ಪ್ರಭಾವಿಸುತ್ತದೆ.
ಈ ಸವಾಲುಗಳ ಕಾರಣದಿಂದಾಗಿ, ಅನೇಕ ಕಂಪನಿಗಳು ಪರ್ಸೆಪ್ಷನ್ ಮಾದರಿ ತರಬೇತಿಯಲ್ಲಿ ಬಾಟಲ್ನೆಕ್ಗಳನ್ನು ಎದುರಿಸುತ್ತಿವೆ — ಸೀಮಿತ ಸಾಮರ್ಥ್ಯ, ಕಡಿಮೆ ಗುಣಮಟ್ಟ ಮತ್ತು ದೀರ್ಘ ಮುನ್ನಡೆ ಸಮಯ. ಆದ್ದರಿಂದ ಅವರು ಮಾಪನೀಯ, ಪರಿಶೀಲಿಸಬಹುದಾದ ಅನೋಟೇಶನ್ ಪೈಪ್ಲೈನ್ಗಳನ್ನು ಒದಗಿಸಬಹುದಾದ ಎಂಟರ್ಪ್ರೈಸ್-ಗ್ರೇಡ್ ಪಾಲುದಾರರನ್ನು ಆರಿಸುತ್ತಾರೆ.
ಸೆನ್ಸರ್ ಫ್ಯೂಷನ್ ಲೇಬಲಿಂಗ್ — ರೋಬೋಟಿಕ್ಸ್ ಡೇಟಾ ಅನೋಟೇಶನ್ನ ಭವಿಷ್ಯ
ಸೆನ್ಸಾರ್ ಫ್ಯೂಷನ್ ಲೇಬಲಿಂಗ್ ಅನೇಕ ಮಾದರಿಗಳಿಂದ (ಲಿಡಾರ್, ರಾಡಾರ್, ವೀಡಿಯೊ) ಡೇಟಾವನ್ನು ಸಂಯೋಜಿಸಿ ಭೌತಿಕ ಜಗತ್ತಿನ ಹೆಚ್ಚು ಸಮೃದ್ಧ ಪ್ರತಿನಿಧಿಯನ್ನು ರಚಿಸುತ್ತದೆ. ರೋಬೋಟಿಕ್ಸ್ ಮತ್ತು ಸ್ವಯಂಚಾಲಿತ ವಾಹನಗಳಿಗೆ, ಇದರ ಅರ್ಥ :
- ಕೆಟ್ಟ ಬೆಳಕು ಅಥವಾ ಅನನುಕೂಲಕರ ಹವಾಮಾನದಲ್ಲಿಯೂ ಹೆಚ್ಚಿನ ವಸ್ತು ಪತ್ತೆ ಖಚಿತತೆ. ಆಳ ಮತ್ತು ವೇಗ ಅಂದಾಜಿನಲ್ಲಿ ಸುಧಾರಣೆ.
- ಕ್ರಾಸ್-ವ್ಯಾಲಿಡೇಟೆಡ್ ಸೆನ್ಸಾರ್ ಇನ್ಪುಟ್ಗಳ ಮೂಲಕ ಹೆಚ್ಚು ಬಲವಾದ ದೃಶ್ಯ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು.
- ಕಡಿಮೆ ಬ್ಲೈಂಡ್ ಸ್ಪಾಟ್ಗಳು ಮತ್ತು ಎಡ್ಜ್-ಕೇಸ್ ವೈಫಲ್ಯಗಳು.
Uber AI Solutions ತನ್ನದೇ ಆದ ಮೊಬೈಲಿಟಿ ಪ್ಲಾಟ್ಫಾರ್ಮ್ ಮತ್ತು ಜಾಗತಿಕ ಪಾಲುದಾರಿಕೆ ಕಾರ್ಯಕ್ರಮಗಳಲ್ಲಿ ಈ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಹತ್ತು ವರ್ಷಗಳಿಂದ ಪರಿಷ್ಕರಿಸಿದೆ.
ನಿರ್ಣಯ — ಕಚ್ಚಾ ಡೇಟಾದಿಂದ ನೈಜ ಜಗತ್ತಿನ ಗ್ರಹಿಕೆಗೆ
ಭೌತಿಕ AI ಅನ್ನು ಅದು ನೋಡಲು ಮತ್ತು ಕಾರ್ಯನಿರ್ವಹಿಸಲು ಕಲಿಸುವ ಡೇಟಾದಷ್ಟು ಮಾತ್ರ ಉತ್ತಮವಾಗಿರುತ್ತದೆ. ಉನ್ನತ ಮಟ್ಟದ ಸಂವೇದಕ ಲೇಬಲಿಂಗ್ ತಂತ್ರಜ್ಞಾನವನ್ನು ಜಾಗತಿಕ ಮಾನವ ಜಾಲ ಮತ್ತು ಕಟ್ಟುನಿಟ್ಟಾದ ಗುಣಮಟ್ಟದ ಚೌಕಟ್ಟಿನೊಂದಿಗೆ ಸಂಯೋಜಿಸುವ ಮೂಲಕ, Uber AI Solutions ಕಂಪನಿಗಳಿಗೆ ನಂಬಿಗಸ್ತವಾದ ರೋಬೋಟ್ಗಳು, ವಾಹನಗಳು ಮತ್ತು ಯಂತ್ರಗಳನ್ನು ನೈಜ ಜಗತ್ತಿನಲ್ಲಿ ಸುರಕ್ಷಿತವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸಲು ನಿರ್ಮಿಸಲು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ.