ScanNet200 3D Semantic Label Benchmark
The 3D semantic labeling task involves predicting a semantic labeling of a 3D scan mesh.
Evaluation and metricsOur evaluation ranks all methods according to the PASCAL VOC intersection-over-union metric (IoU). IoU = TP/(TP+FP+FN), where TP, FP, and FN are the numbers of true positive, false positive, and false negative pixels, respectively. Predicted labels are evaluated per-vertex over the respective 3D scan mesh; for 3D approaches that operate on other representations like grids or points, the predicted labels should be mapped onto the mesh vertices (e.g., one such example for grid to mesh vertices is provided in the evaluation helpers).
This table lists the benchmark results for the ScanNet200 3D semantic label scenario.
| Method | Info | avg iou | head iou | common iou | tail iou | alarm clock | armchair | backpack | bag | ball | bar | basket | bathroom cabinet | bathroom counter | bathroom stall | bathroom stall door | bathroom vanity | bathtub | bed | bench | bicycle | bin | blackboard | blanket | blinds | board | book | bookshelf | bottle | bowl | box | broom | bucket | bulletin board | cabinet | calendar | candle | cart | case of water bottles | cd case | ceiling | ceiling light | chair | clock | closet | closet door | closet rod | closet wall | clothes | clothes dryer | coat rack | coffee kettle | coffee maker | coffee table | column | computer tower | container | copier | couch | counter | crate | cup | curtain | cushion | decoration | desk | dining table | dish rack | dishwasher | divider | door | doorframe | dresser | dumbbell | dustpan | end table | fan | file cabinet | fire alarm | fire extinguisher | fireplace | floor | folded chair | furniture | guitar | guitar case | hair dryer | handicap bar | hat | headphones | ironing board | jacket | keyboard | keyboard piano | kitchen cabinet | kitchen counter | ladder | lamp | laptop | laundry basket | laundry detergent | laundry hamper | ledge | light | light switch | luggage | machine | mailbox | mat | mattress | microwave | mini fridge | mirror | monitor | mouse | music stand | nightstand | object | office chair | ottoman | oven | paper | paper bag | paper cutter | paper towel dispenser | paper towel roll | person | piano | picture | pillar | pillow | pipe | plant | plate | plunger | poster | potted plant | power outlet | power strip | printer | projector | projector screen | purse | rack | radiator | rail | range hood | recycling bin | refrigerator | scale | seat | shelf | shoe | shower | shower curtain | shower curtain rod | shower door | shower floor | shower head | shower wall | sign | sink | soap dish | soap dispenser | sofa chair | speaker | stair rail | stairs | stand | stool | storage bin | storage container | storage organizer | stove | structure | stuffed animal | suitcase | table | telephone | tissue box | toaster | toaster oven | toilet | toilet paper | toilet paper dispenser | toilet paper holder | toilet seat cover dispenser | towel | trash bin | trash can | tray | tube | tv | tv stand | vacuum cleaner | vent | wall | wardrobe | washing machine | water bottle | water cooler | water pitcher | whiteboard | window | windowsill |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ALS-MinkowskiNet | 0.414 3 | 0.610 3 | 0.322 3 | 0.271 2 | 0.542 2 | 0.153 3 | 0.159 12 | 0.000 3 | 0.000 8 | 0.000 1 | 0.404 4 | 0.503 5 | 0.532 7 | 0.672 17 | 0.804 5 | 0.285 1 | 0.888 3 | 0.000 3 | 0.900 3 | 0.226 3 | 0.087 2 | 0.598 5 | 0.342 5 | 0.671 1 | 0.217 11 | 0.087 4 | 0.449 4 | 0.000 1 | 0.000 3 | 0.253 3 | 0.477 7 | 1.000 1 | 0.000 1 | 0.118 6 | 0.000 3 | 0.905 1 | 0.071 14 | 0.710 3 | 0.076 3 | 0.047 17 | 0.665 2 | 0.376 9 | 0.981 1 | 0.000 1 | 0.000 2 | 0.466 7 | 0.632 8 | 0.113 4 | 0.769 1 | 0.956 5 | 0.795 2 | 0.031 9 | 0.314 1 | 0.936 1 | 0.000 1 | 0.390 2 | 0.601 4 | 0.000 7 | 0.458 9 | 0.366 3 | 0.719 4 | 0.440 6 | 0.564 1 | 0.699 4 | 0.314 1 | 0.464 8 | 0.784 3 | 0.200 1 | 0.283 6 | 0.973 1 | 0.142 9 | 0.000 1 | 0.250 8 | 0.285 6 | 0.220 8 | 0.718 1 | 0.752 6 | 0.723 2 | 0.460 1 | 0.248 16 | 0.475 10 | 0.463 14 | 0.000 4 | 0.000 1 | 0.446 9 | 0.021 5 | 0.025 11 | 0.285 1 | 0.000 5 | 0.972 1 | 0.149 8 | 0.769 1 | 0.230 3 | 0.535 1 | 0.879 3 | 0.252 9 | 0.000 1 | 0.693 1 | 0.129 2 | 0.000 14 | 0.000 4 | 0.000 1 | 0.447 1 | 0.958 1 | 0.662 9 | 0.159 2 | 0.598 4 | 0.780 12 | 0.344 2 | 0.646 4 | 0.106 6 | 0.893 3 | 0.135 3 | 0.455 4 | 0.000 1 | 0.194 3 | 0.259 1 | 0.726 3 | 0.475 4 | 0.000 9 | 0.000 1 | 0.741 1 | 0.865 2 | 0.571 2 | 0.817 3 | 0.445 4 | 0.000 1 | 0.506 3 | 0.630 4 | 0.230 13 | 0.916 2 | 0.728 1 | 0.635 1 | 1.000 1 | 0.252 7 | 0.000 1 | 0.804 3 | 0.697 8 | 0.137 11 | 0.043 8 | 0.717 3 | 0.807 4 | 0.000 1 | 0.510 14 | 0.245 2 | 0.000 7 | 0.000 1 | 0.709 3 | 0.000 2 | 0.000 1 | 0.703 3 | 0.572 5 | 0.646 2 | 0.223 11 | 0.531 6 | 0.984 1 | 0.397 4 | 0.813 1 | 0.798 1 | 0.135 13 | 0.800 1 | 0.000 1 | 0.097 2 | 0.832 3 | 0.752 9 | 0.842 8 | 0.000 1 | 0.852 1 | 0.149 10 | 0.846 11 | 0.000 1 | 0.666 5 | 0.359 6 | 0.252 9 | 0.777 1 | 0.690 2 | |||||||||||||||||||||||||||||
| Guangda Ji, Silvan Weder, Francis Engelmann, Marc Pollefeys, Hermann Blum: ARKit LabelMaker: A New Scale for Indoor 3D Scene Understanding. CVPR 2025 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| AWCS | 0.305 15 | 0.508 15 | 0.225 15 | 0.142 12 | 0.463 14 | 0.063 14 | 0.195 10 | 0.000 3 | 0.000 8 | 0.000 1 | 0.467 3 | 0.551 3 | 0.504 9 | 0.773 7 | 0.764 15 | 0.142 14 | 0.029 18 | 0.000 3 | 0.626 14 | 0.100 12 | 0.000 10 | 0.360 14 | 0.179 16 | 0.507 14 | 0.137 16 | 0.006 9 | 0.300 13 | 0.000 1 | 0.000 3 | 0.172 9 | 0.364 16 | 0.512 10 | 0.000 1 | 0.056 15 | 0.000 3 | 0.865 14 | 0.093 4 | 0.634 18 | 0.000 8 | 0.071 14 | 0.396 15 | 0.296 17 | 0.876 10 | 0.000 1 | 0.000 2 | 0.373 14 | 0.436 17 | 0.063 9 | 0.749 2 | 0.877 11 | 0.721 13 | 0.131 3 | 0.124 15 | 0.804 16 | 0.000 1 | 0.000 11 | 0.515 13 | 0.010 6 | 0.452 11 | 0.252 10 | 0.578 15 | 0.417 9 | 0.179 18 | 0.484 10 | 0.171 7 | 0.337 15 | 0.606 13 | 0.000 7 | 0.115 11 | 0.937 15 | 0.142 9 | 0.000 1 | 0.008 12 | 0.000 15 | 0.157 17 | 0.484 15 | 0.402 18 | 0.501 16 | 0.339 10 | 0.553 7 | 0.529 3 | 0.478 13 | 0.000 4 | 0.000 1 | 0.404 11 | 0.001 11 | 0.022 13 | 0.077 10 | 0.000 5 | 0.894 13 | 0.219 7 | 0.628 7 | 0.093 16 | 0.305 15 | 0.886 1 | 0.233 10 | 0.000 1 | 0.603 10 | 0.112 6 | 0.023 9 | 0.000 4 | 0.000 1 | 0.000 12 | 0.741 7 | 0.664 8 | 0.097 16 | 0.253 15 | 0.782 11 | 0.264 12 | 0.523 12 | 0.154 2 | 0.707 17 | 0.000 6 | 0.411 9 | 0.000 1 | 0.000 8 | 0.000 3 | 0.332 17 | 0.000 5 | 0.000 9 | 0.000 1 | 0.602 8 | 0.595 11 | 0.185 14 | 0.656 17 | 0.159 7 | 0.000 1 | 0.355 12 | 0.424 16 | 0.154 16 | 0.729 16 | 0.516 11 | 0.220 11 | 0.620 4 | 0.084 14 | 0.000 1 | 0.707 15 | 0.651 14 | 0.173 5 | 0.014 10 | 0.381 18 | 0.582 15 | 0.000 1 | 0.619 3 | 0.049 13 | 0.000 7 | 0.000 1 | 0.702 4 | 0.000 2 | 0.000 1 | 0.302 17 | 0.489 16 | 0.317 14 | 0.334 7 | 0.392 8 | 0.922 15 | 0.254 14 | 0.533 14 | 0.394 14 | 0.129 15 | 0.613 16 | 0.000 1 | 0.000 12 | 0.820 6 | 0.649 12 | 0.749 14 | 0.000 1 | 0.782 15 | 0.282 6 | 0.863 7 | 0.000 1 | 0.288 16 | 0.006 13 | 0.220 12 | 0.633 15 | 0.542 3 | |||||||||||||||||||||||||||||
| : Long-Tailed 3D Semantic Segmentation with Adaptive Weight Constraint and Sampling. ICRA 2024 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| DITR | 0.449 1 | 0.629 1 | 0.392 1 | 0.289 1 | 0.650 1 | 0.168 2 | 0.862 1 | 0.000 3 | 0.313 4 | 0.000 1 | 0.580 1 | 0.568 2 | 0.564 4 | 0.766 8 | 0.867 1 | 0.238 5 | 0.949 1 | 0.000 3 | 0.866 4 | 0.300 1 | 0.000 10 | 0.664 1 | 0.482 1 | 0.508 13 | 0.317 1 | 0.420 1 | 0.551 2 | 0.000 1 | 0.000 3 | 0.486 2 | 0.519 1 | 0.662 5 | 0.000 1 | 0.385 1 | 0.000 3 | 0.901 3 | 0.079 10 | 0.727 2 | 0.000 8 | 0.160 3 | 0.606 4 | 0.417 5 | 0.967 3 | 0.000 1 | 0.000 2 | 0.498 5 | 0.596 12 | 0.130 2 | 0.728 3 | 0.998 1 | 0.805 1 | 0.000 17 | 0.314 1 | 0.934 2 | 0.000 1 | 0.278 4 | 0.636 1 | 0.000 7 | 0.403 13 | 0.367 2 | 0.741 3 | 0.484 2 | 0.500 2 | 1.000 1 | 0.113 12 | 0.828 1 | 0.815 2 | 0.000 7 | 0.733 2 | 0.969 4 | 0.374 2 | 0.000 1 | 0.579 1 | 1.000 1 | 0.230 6 | 0.617 6 | 0.983 1 | 0.729 1 | 0.423 4 | 0.855 1 | 0.508 6 | 0.622 2 | 0.018 3 | 0.000 1 | 0.591 3 | 0.034 4 | 0.028 10 | 0.066 12 | 0.869 1 | 0.904 8 | 0.334 2 | 0.651 5 | 0.716 1 | 0.514 2 | 0.871 7 | 0.315 4 | 0.000 1 | 0.664 3 | 0.128 3 | 0.014 10 | 0.000 4 | 0.000 1 | 0.392 3 | 0.851 3 | 0.817 1 | 0.153 3 | 0.823 1 | 0.991 1 | 0.318 4 | 0.680 2 | 0.134 3 | 0.913 1 | 0.157 2 | 0.448 5 | 0.000 1 | 0.000 8 | 0.000 3 | 0.826 1 | 0.978 1 | 0.091 6 | 0.000 1 | 0.660 5 | 0.647 4 | 0.571 2 | 0.804 4 | 0.001 10 | 0.000 1 | 0.480 4 | 0.700 1 | 0.421 6 | 0.947 1 | 0.433 15 | 0.411 4 | 0.148 7 | 0.262 5 | 0.000 1 | 0.849 1 | 0.709 7 | 0.138 10 | 0.150 2 | 0.714 4 | 0.889 2 | 0.000 1 | 0.698 1 | 0.222 4 | 0.000 7 | 0.000 1 | 0.720 2 | 0.000 2 | 0.000 1 | 0.805 1 | 0.600 2 | 0.642 3 | 0.268 10 | 0.904 1 | 0.982 2 | 0.477 2 | 0.632 7 | 0.718 2 | 0.139 10 | 0.776 2 | 0.000 1 | 0.178 1 | 0.886 2 | 0.962 1 | 0.839 9 | 0.000 1 | 0.851 2 | 0.043 13 | 0.869 5 | 0.000 1 | 0.710 1 | 0.315 7 | 0.348 4 | 0.753 2 | 0.397 8 | |||||||||||||||||||||||||||||
| Karim Abou Zeid, Kadir Yilmaz, Daan de Geus, Alexander Hermans, David Adrian, Timm Linder, Bastian Leibe: DINO in the Room: Leveraging 2D Foundation Models for 3D Segmentation. 3DV 2026 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| PPT-SpUNet-F.T. | 0.332 13 | 0.556 7 | 0.270 8 | 0.123 15 | 0.519 5 | 0.091 8 | 0.349 5 | 0.000 3 | 0.000 8 | 0.000 1 | 0.339 10 | 0.383 11 | 0.498 11 | 0.833 5 | 0.807 4 | 0.241 4 | 0.584 10 | 0.000 3 | 0.755 8 | 0.124 9 | 0.000 10 | 0.608 3 | 0.330 8 | 0.530 10 | 0.314 2 | 0.000 10 | 0.374 9 | 0.000 1 | 0.000 3 | 0.197 6 | 0.459 8 | 0.000 12 | 0.000 1 | 0.117 7 | 0.000 3 | 0.876 8 | 0.095 2 | 0.682 10 | 0.000 8 | 0.086 9 | 0.518 8 | 0.433 3 | 0.930 5 | 0.000 1 | 0.000 2 | 0.563 3 | 0.542 15 | 0.077 7 | 0.715 4 | 0.858 12 | 0.756 6 | 0.008 16 | 0.171 13 | 0.874 9 | 0.000 1 | 0.039 7 | 0.550 12 | 0.000 7 | 0.545 5 | 0.256 9 | 0.657 9 | 0.453 5 | 0.351 11 | 0.449 11 | 0.213 6 | 0.392 13 | 0.611 12 | 0.000 7 | 0.037 16 | 0.946 7 | 0.138 14 | 0.000 1 | 0.000 13 | 0.063 11 | 0.308 2 | 0.537 9 | 0.796 5 | 0.673 5 | 0.323 12 | 0.392 11 | 0.400 15 | 0.509 8 | 0.000 4 | 0.000 1 | 0.649 1 | 0.000 12 | 0.023 12 | 0.000 13 | 0.000 5 | 0.914 7 | 0.002 17 | 0.506 17 | 0.163 12 | 0.359 9 | 0.872 6 | 0.000 13 | 0.000 1 | 0.623 8 | 0.112 6 | 0.001 12 | 0.000 4 | 0.000 1 | 0.021 10 | 0.753 6 | 0.565 16 | 0.150 5 | 0.579 5 | 0.806 10 | 0.267 10 | 0.616 5 | 0.042 15 | 0.783 14 | 0.000 6 | 0.374 12 | 0.000 1 | 0.000 8 | 0.000 3 | 0.620 9 | 0.000 5 | 0.000 9 | 0.000 1 | 0.572 14 | 0.634 6 | 0.350 10 | 0.792 5 | 0.000 11 | 0.000 1 | 0.376 10 | 0.535 7 | 0.378 7 | 0.855 8 | 0.672 4 | 0.074 14 | 0.000 12 | 0.185 11 | 0.000 1 | 0.727 13 | 0.660 13 | 0.076 18 | 0.000 11 | 0.432 13 | 0.646 11 | 0.000 1 | 0.594 8 | 0.006 14 | 0.000 7 | 0.000 1 | 0.658 8 | 0.000 2 | 0.000 1 | 0.661 5 | 0.549 11 | 0.300 15 | 0.291 9 | 0.045 15 | 0.942 12 | 0.304 9 | 0.600 9 | 0.572 8 | 0.135 13 | 0.695 6 | 0.000 1 | 0.008 9 | 0.793 10 | 0.942 2 | 0.899 3 | 0.000 1 | 0.816 7 | 0.181 8 | 0.897 3 | 0.000 1 | 0.679 4 | 0.223 9 | 0.264 6 | 0.691 6 | 0.345 12 | |||||||||||||||||||||||||||||
| Xiaoyang Wu, Zhuotao Tian, Xin Wen, Bohao Peng, Xihui Liu, Kaicheng Yu, Hengshuang Zhao: Towards Large-scale 3D Representation Learning with Multi-dataset Point Prompt Training. CVPR 2024 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| PTv3 ScanNet200 | 0.393 4 | 0.592 4 | 0.330 2 | 0.216 4 | 0.520 4 | 0.109 6 | 0.108 17 | 0.000 3 | 0.337 2 | 0.000 1 | 0.310 13 | 0.394 10 | 0.494 12 | 0.753 10 | 0.848 2 | 0.256 3 | 0.717 9 | 0.000 3 | 0.842 5 | 0.192 6 | 0.065 4 | 0.449 11 | 0.346 4 | 0.546 7 | 0.190 14 | 0.000 10 | 0.384 8 | 0.000 1 | 0.000 3 | 0.218 5 | 0.505 2 | 0.791 3 | 0.000 1 | 0.136 5 | 0.000 3 | 0.903 2 | 0.073 13 | 0.687 7 | 0.000 8 | 0.168 2 | 0.551 6 | 0.387 8 | 0.941 4 | 0.000 1 | 0.000 2 | 0.397 13 | 0.654 3 | 0.000 10 | 0.714 5 | 0.759 16 | 0.752 8 | 0.118 4 | 0.264 5 | 0.926 3 | 0.000 1 | 0.048 6 | 0.575 6 | 0.000 7 | 0.597 2 | 0.366 3 | 0.755 1 | 0.469 3 | 0.474 3 | 0.798 2 | 0.140 10 | 0.617 3 | 0.692 8 | 0.000 7 | 0.592 4 | 0.971 2 | 0.188 4 | 0.000 1 | 0.133 10 | 0.593 2 | 0.349 1 | 0.650 4 | 0.717 9 | 0.699 4 | 0.455 2 | 0.790 2 | 0.523 4 | 0.636 1 | 0.301 1 | 0.000 1 | 0.622 2 | 0.000 12 | 0.017 15 | 0.259 3 | 0.000 5 | 0.921 4 | 0.337 1 | 0.733 2 | 0.210 5 | 0.514 2 | 0.860 9 | 0.407 1 | 0.000 1 | 0.688 2 | 0.109 8 | 0.000 14 | 0.000 4 | 0.000 1 | 0.151 6 | 0.671 9 | 0.782 2 | 0.115 14 | 0.641 2 | 0.903 2 | 0.349 1 | 0.616 5 | 0.088 7 | 0.832 9 | 0.000 6 | 0.480 3 | 0.000 1 | 0.428 1 | 0.000 3 | 0.497 11 | 0.000 5 | 0.000 9 | 0.000 1 | 0.662 4 | 0.690 3 | 0.612 1 | 0.828 1 | 0.575 2 | 0.000 1 | 0.404 8 | 0.644 2 | 0.325 8 | 0.887 5 | 0.728 1 | 0.009 17 | 0.134 8 | 0.026 18 | 0.000 1 | 0.761 4 | 0.731 5 | 0.172 6 | 0.077 4 | 0.528 9 | 0.727 8 | 0.000 1 | 0.603 5 | 0.220 5 | 0.022 3 | 0.000 1 | 0.740 1 | 0.000 2 | 0.000 1 | 0.661 5 | 0.586 3 | 0.566 5 | 0.436 4 | 0.531 6 | 0.978 4 | 0.457 3 | 0.708 4 | 0.583 7 | 0.141 7 | 0.748 3 | 0.000 1 | 0.026 5 | 0.822 4 | 0.871 4 | 0.879 6 | 0.000 1 | 0.851 2 | 0.405 2 | 0.914 1 | 0.000 1 | 0.682 3 | 0.000 16 | 0.281 5 | 0.738 3 | 0.463 6 | |||||||||||||||||||||||||||||
| Xiaoyang Wu, Li Jiang, Peng-Shuai Wang, Zhijian Liu, Xihui Liu, Yu Qiao, Wanli Ouyang, Tong He, Hengshuang Zhao: Point Transformer V3: Simpler, Faster, Stronger. CVPR 2024 (Oral) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| LGround | 0.272 16 | 0.485 16 | 0.184 16 | 0.106 16 | 0.476 12 | 0.077 11 | 0.218 9 | 0.000 3 | 0.000 8 | 0.000 1 | 0.547 2 | 0.295 12 | 0.540 6 | 0.746 11 | 0.745 16 | 0.058 17 | 0.112 17 | 0.005 1 | 0.658 12 | 0.077 16 | 0.000 10 | 0.322 15 | 0.178 17 | 0.512 12 | 0.190 14 | 0.199 2 | 0.277 16 | 0.000 1 | 0.000 3 | 0.173 8 | 0.399 13 | 0.000 12 | 0.000 1 | 0.039 17 | 0.000 3 | 0.858 15 | 0.085 7 | 0.676 12 | 0.002 6 | 0.103 6 | 0.498 9 | 0.323 15 | 0.703 13 | 0.000 1 | 0.000 2 | 0.296 16 | 0.549 13 | 0.216 1 | 0.702 6 | 0.768 15 | 0.718 15 | 0.028 10 | 0.092 17 | 0.786 17 | 0.000 1 | 0.000 11 | 0.453 17 | 0.022 5 | 0.251 18 | 0.252 10 | 0.572 16 | 0.348 15 | 0.321 12 | 0.514 7 | 0.063 15 | 0.279 17 | 0.552 16 | 0.000 7 | 0.019 17 | 0.932 16 | 0.132 16 | 0.000 1 | 0.000 13 | 0.000 15 | 0.156 18 | 0.457 16 | 0.623 13 | 0.518 15 | 0.265 17 | 0.358 12 | 0.381 16 | 0.395 15 | 0.000 4 | 0.000 1 | 0.127 18 | 0.012 9 | 0.051 1 | 0.000 13 | 0.000 5 | 0.886 14 | 0.014 14 | 0.437 18 | 0.179 9 | 0.244 16 | 0.826 16 | 0.000 13 | 0.000 1 | 0.599 11 | 0.136 1 | 0.085 3 | 0.000 4 | 0.000 1 | 0.000 12 | 0.565 14 | 0.612 14 | 0.143 6 | 0.207 16 | 0.566 15 | 0.232 16 | 0.446 16 | 0.127 4 | 0.708 16 | 0.000 6 | 0.384 10 | 0.000 1 | 0.000 8 | 0.000 3 | 0.402 15 | 0.000 5 | 0.059 7 | 0.000 1 | 0.525 16 | 0.566 12 | 0.229 13 | 0.659 16 | 0.000 11 | 0.000 1 | 0.265 16 | 0.446 15 | 0.147 17 | 0.720 18 | 0.597 9 | 0.066 15 | 0.000 12 | 0.187 10 | 0.000 1 | 0.726 14 | 0.467 18 | 0.134 13 | 0.000 11 | 0.413 16 | 0.629 13 | 0.000 1 | 0.363 17 | 0.055 11 | 0.022 3 | 0.000 1 | 0.626 12 | 0.000 2 | 0.000 1 | 0.323 16 | 0.479 18 | 0.154 17 | 0.117 16 | 0.028 17 | 0.901 16 | 0.243 16 | 0.415 17 | 0.295 18 | 0.143 6 | 0.610 17 | 0.000 1 | 0.000 12 | 0.777 13 | 0.397 18 | 0.324 17 | 0.000 1 | 0.778 16 | 0.179 9 | 0.702 17 | 0.000 1 | 0.274 17 | 0.404 5 | 0.233 11 | 0.622 16 | 0.398 7 | |||||||||||||||||||||||||||||
| David Rozenberszki, Or Litany, Angela Dai: Language-Grounded Indoor 3D Semantic Segmentation in the Wild. arXiv | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| L3DETR-ScanNet_200 | 0.336 9 | 0.533 12 | 0.279 7 | 0.155 11 | 0.508 6 | 0.073 12 | 0.101 18 | 0.000 3 | 0.058 7 | 0.000 1 | 0.294 15 | 0.233 15 | 0.548 5 | 0.927 2 | 0.788 11 | 0.264 2 | 0.463 12 | 0.000 3 | 0.638 13 | 0.098 14 | 0.014 8 | 0.411 13 | 0.226 14 | 0.525 11 | 0.225 10 | 0.010 8 | 0.397 7 | 0.000 1 | 0.000 3 | 0.192 7 | 0.380 15 | 0.598 7 | 0.000 1 | 0.117 7 | 0.000 3 | 0.883 7 | 0.082 8 | 0.689 5 | 0.000 8 | 0.032 18 | 0.549 7 | 0.417 5 | 0.910 6 | 0.000 1 | 0.000 2 | 0.448 8 | 0.613 10 | 0.000 10 | 0.697 7 | 0.960 4 | 0.759 5 | 0.158 2 | 0.293 3 | 0.883 8 | 0.000 1 | 0.312 3 | 0.583 5 | 0.079 4 | 0.422 12 | 0.068 18 | 0.660 8 | 0.418 8 | 0.298 13 | 0.430 13 | 0.114 11 | 0.526 6 | 0.776 4 | 0.051 3 | 0.679 3 | 0.946 7 | 0.152 7 | 0.000 1 | 0.183 9 | 0.000 15 | 0.211 9 | 0.511 11 | 0.409 17 | 0.565 13 | 0.355 9 | 0.448 8 | 0.512 5 | 0.557 4 | 0.000 4 | 0.000 1 | 0.420 10 | 0.000 12 | 0.007 17 | 0.104 7 | 0.000 5 | 0.125 18 | 0.330 3 | 0.514 16 | 0.146 13 | 0.321 14 | 0.860 9 | 0.174 12 | 0.000 1 | 0.629 7 | 0.075 14 | 0.000 14 | 0.000 4 | 0.000 1 | 0.002 11 | 0.671 9 | 0.712 7 | 0.141 7 | 0.339 13 | 0.856 5 | 0.261 13 | 0.529 11 | 0.067 10 | 0.835 7 | 0.000 6 | 0.369 13 | 0.000 1 | 0.259 2 | 0.000 3 | 0.629 7 | 0.000 5 | 0.487 1 | 0.000 1 | 0.579 12 | 0.646 5 | 0.107 18 | 0.720 11 | 0.122 8 | 0.000 1 | 0.333 15 | 0.505 11 | 0.303 10 | 0.908 4 | 0.503 14 | 0.565 2 | 0.074 9 | 0.324 1 | 0.000 1 | 0.740 9 | 0.661 12 | 0.109 14 | 0.000 11 | 0.427 14 | 0.563 18 | 0.000 1 | 0.579 11 | 0.108 8 | 0.000 7 | 0.000 1 | 0.664 7 | 0.000 2 | 0.000 1 | 0.641 8 | 0.539 12 | 0.416 8 | 0.515 2 | 0.256 12 | 0.940 13 | 0.312 7 | 0.209 18 | 0.620 4 | 0.138 12 | 0.636 12 | 0.000 1 | 0.000 12 | 0.775 14 | 0.861 5 | 0.765 13 | 0.000 1 | 0.801 10 | 0.119 12 | 0.860 9 | 0.000 1 | 0.687 2 | 0.001 15 | 0.192 15 | 0.679 10 | 0.699 1 | |||||||||||||||||||||||||||||
| Yanmin Wu, Qiankun Gao, Renrui Zhang, Jian Zhang: Language-Assisted 3D Scene Understanding. arXiv23.12 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Volt | 0.416 2 | 0.619 2 | 0.318 4 | 0.269 3 | 0.528 3 | 0.138 4 | 0.862 1 | 0.000 3 | 0.356 1 | 0.000 1 | 0.380 8 | 0.438 7 | 0.616 2 | 0.952 1 | 0.795 7 | 0.143 13 | 0.891 2 | 0.000 3 | 0.904 2 | 0.227 2 | 0.087 2 | 0.606 4 | 0.237 13 | 0.625 2 | 0.238 8 | 0.188 3 | 0.429 5 | 0.000 1 | 0.000 3 | 0.251 4 | 0.504 3 | 0.791 3 | 0.000 1 | 0.218 4 | 0.000 3 | 0.900 5 | 0.082 8 | 0.735 1 | 0.097 1 | 0.093 8 | 0.754 1 | 0.475 1 | 0.981 1 | 0.000 1 | 0.000 2 | 0.425 9 | 0.653 4 | 0.000 10 | 0.696 8 | 0.988 2 | 0.773 3 | 0.000 17 | 0.265 4 | 0.905 5 | 0.000 1 | 0.000 11 | 0.631 2 | 0.000 7 | 0.493 8 | 0.401 1 | 0.753 2 | 0.499 1 | 0.392 9 | 0.437 12 | 0.000 17 | 0.609 4 | 0.881 1 | 0.000 7 | 0.277 7 | 0.958 5 | 0.142 9 | 0.000 1 | 0.518 2 | 0.000 15 | 0.274 4 | 0.700 2 | 0.752 6 | 0.709 3 | 0.421 5 | 0.431 9 | 0.462 11 | 0.583 3 | 0.000 4 | 0.000 1 | 0.553 5 | 0.020 6 | 0.007 17 | 0.218 4 | 0.631 2 | 0.934 2 | 0.005 16 | 0.614 8 | 0.223 4 | 0.430 4 | 0.884 2 | 0.407 1 | 0.000 1 | 0.652 5 | 0.040 18 | 0.000 14 | 0.000 4 | 0.000 1 | 0.398 2 | 0.855 2 | 0.635 11 | 0.151 4 | 0.624 3 | 0.903 2 | 0.335 3 | 0.686 1 | 0.063 11 | 0.865 4 | 0.000 6 | 0.551 1 | 0.000 1 | 0.000 8 | 0.000 3 | 0.678 4 | 0.000 5 | 0.000 9 | 0.000 1 | 0.696 2 | 0.962 1 | 0.410 8 | 0.679 15 | 0.997 1 | 0.000 1 | 0.542 2 | 0.635 3 | 0.588 1 | 0.909 3 | 0.728 1 | 0.414 3 | 1.000 1 | 0.261 6 | 0.000 1 | 0.834 2 | 0.737 4 | 0.136 12 | 0.066 5 | 0.888 1 | 0.924 1 | 0.000 1 | 0.541 12 | 0.069 10 | 0.000 7 | 0.000 1 | 0.682 6 | 0.000 2 | 0.000 1 | 0.747 2 | 0.639 1 | 0.603 4 | 0.329 8 | 0.778 2 | 0.982 2 | 0.501 1 | 0.725 3 | 0.680 3 | 0.141 7 | 0.719 4 | 0.000 1 | 0.000 12 | 0.893 1 | 0.842 6 | 0.930 1 | 0.000 1 | 0.850 4 | 0.272 7 | 0.898 2 | 0.000 1 | 0.351 14 | 0.576 1 | 0.357 3 | 0.721 4 | 0.324 13 | |||||||||||||||||||||||||||||
| Kadir Yilmaz, Adrian Kruse, Tristan Höfer, Daan de Geus, Bastian Leibe: Volume Transformer: Revisiting Vanilla Transformers for 3D Scene Understanding. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| CeCo | 0.340 8 | 0.551 10 | 0.247 14 | 0.181 7 | 0.475 13 | 0.057 16 | 0.142 13 | 0.000 3 | 0.000 8 | 0.000 1 | 0.387 6 | 0.463 6 | 0.499 10 | 0.924 3 | 0.774 12 | 0.213 6 | 0.257 14 | 0.000 3 | 0.546 16 | 0.100 12 | 0.006 9 | 0.615 2 | 0.177 18 | 0.534 8 | 0.246 6 | 0.000 10 | 0.400 6 | 0.000 1 | 0.338 1 | 0.006 17 | 0.484 6 | 0.609 6 | 0.000 1 | 0.083 12 | 0.000 3 | 0.873 10 | 0.089 5 | 0.661 15 | 0.000 8 | 0.048 16 | 0.560 5 | 0.408 7 | 0.892 9 | 0.000 1 | 0.000 2 | 0.586 1 | 0.616 9 | 0.000 10 | 0.692 9 | 0.900 9 | 0.721 13 | 0.162 1 | 0.228 7 | 0.860 12 | 0.000 1 | 0.000 11 | 0.575 6 | 0.083 3 | 0.550 4 | 0.347 5 | 0.624 14 | 0.410 11 | 0.360 10 | 0.740 3 | 0.109 13 | 0.321 16 | 0.660 9 | 0.000 7 | 0.121 10 | 0.939 14 | 0.143 8 | 0.000 1 | 0.400 3 | 0.003 13 | 0.190 12 | 0.564 7 | 0.652 11 | 0.615 12 | 0.421 5 | 0.304 14 | 0.579 1 | 0.547 6 | 0.000 4 | 0.000 1 | 0.296 15 | 0.000 12 | 0.030 9 | 0.096 8 | 0.000 5 | 0.916 5 | 0.037 13 | 0.551 13 | 0.171 10 | 0.376 8 | 0.865 8 | 0.286 6 | 0.000 1 | 0.633 6 | 0.102 12 | 0.027 8 | 0.011 3 | 0.000 1 | 0.000 12 | 0.474 15 | 0.742 5 | 0.133 8 | 0.311 14 | 0.824 9 | 0.242 14 | 0.503 15 | 0.068 9 | 0.828 10 | 0.000 6 | 0.429 8 | 0.000 1 | 0.063 5 | 0.000 3 | 0.781 2 | 0.000 5 | 0.000 9 | 0.000 1 | 0.665 3 | 0.633 7 | 0.450 6 | 0.818 2 | 0.000 11 | 0.000 1 | 0.429 6 | 0.532 8 | 0.226 14 | 0.825 12 | 0.510 12 | 0.377 6 | 0.709 3 | 0.079 15 | 0.000 1 | 0.753 6 | 0.683 9 | 0.102 16 | 0.063 6 | 0.401 17 | 0.620 14 | 0.000 1 | 0.619 3 | 0.000 15 | 0.000 7 | 0.000 1 | 0.595 14 | 0.000 2 | 0.000 1 | 0.345 15 | 0.564 7 | 0.411 9 | 0.603 1 | 0.384 9 | 0.945 10 | 0.266 12 | 0.643 6 | 0.367 15 | 0.304 1 | 0.663 11 | 0.000 1 | 0.010 7 | 0.726 16 | 0.767 8 | 0.898 4 | 0.000 1 | 0.784 14 | 0.435 1 | 0.861 8 | 0.000 1 | 0.447 11 | 0.000 16 | 0.257 8 | 0.656 12 | 0.377 10 | |||||||||||||||||||||||||||||
| Zhisheng Zhong, Jiequan Cui, Yibo Yang, Xiaoyang Wu, Xiaojuan Qi, Xiangyu Zhang, Jiaya Jia: Understanding Imbalanced Semantic Segmentation Through Neural Collapse. CVPR 2023 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| OctFormer ScanNet200 | 0.326 14 | 0.539 11 | 0.265 11 | 0.131 13 | 0.499 7 | 0.110 5 | 0.522 4 | 0.000 3 | 0.000 8 | 0.000 1 | 0.318 12 | 0.427 8 | 0.455 16 | 0.743 12 | 0.765 14 | 0.175 11 | 0.842 5 | 0.000 3 | 0.828 6 | 0.204 5 | 0.033 7 | 0.429 12 | 0.335 6 | 0.601 3 | 0.312 3 | 0.000 10 | 0.357 11 | 0.000 1 | 0.000 3 | 0.047 12 | 0.423 10 | 0.000 12 | 0.000 1 | 0.105 10 | 0.000 3 | 0.873 10 | 0.079 10 | 0.670 13 | 0.000 8 | 0.117 5 | 0.471 14 | 0.432 4 | 0.829 12 | 0.000 1 | 0.000 2 | 0.584 2 | 0.417 18 | 0.089 6 | 0.684 10 | 0.837 13 | 0.705 17 | 0.021 12 | 0.178 12 | 0.892 7 | 0.000 1 | 0.028 8 | 0.505 14 | 0.000 7 | 0.457 10 | 0.200 15 | 0.662 5 | 0.412 10 | 0.244 16 | 0.496 8 | 0.000 17 | 0.451 9 | 0.626 10 | 0.000 7 | 0.102 12 | 0.943 10 | 0.138 14 | 0.000 1 | 0.000 13 | 0.149 8 | 0.291 3 | 0.534 10 | 0.722 8 | 0.632 8 | 0.331 11 | 0.253 15 | 0.453 12 | 0.487 12 | 0.000 4 | 0.000 1 | 0.479 7 | 0.000 12 | 0.022 13 | 0.000 13 | 0.000 5 | 0.900 11 | 0.128 11 | 0.684 3 | 0.164 11 | 0.413 5 | 0.854 11 | 0.000 13 | 0.000 1 | 0.512 17 | 0.074 15 | 0.003 11 | 0.000 4 | 0.000 1 | 0.000 12 | 0.469 16 | 0.613 13 | 0.132 9 | 0.529 8 | 0.871 4 | 0.227 17 | 0.582 8 | 0.026 18 | 0.787 13 | 0.000 6 | 0.339 16 | 0.000 1 | 0.000 8 | 0.000 3 | 0.626 8 | 0.000 5 | 0.029 8 | 0.000 1 | 0.587 10 | 0.612 9 | 0.411 7 | 0.724 10 | 0.000 11 | 0.000 1 | 0.407 7 | 0.552 6 | 0.513 4 | 0.849 11 | 0.655 5 | 0.408 5 | 0.000 12 | 0.296 2 | 0.000 1 | 0.686 16 | 0.645 15 | 0.145 8 | 0.022 9 | 0.414 15 | 0.633 12 | 0.000 1 | 0.637 2 | 0.224 3 | 0.000 7 | 0.000 1 | 0.650 9 | 0.000 2 | 0.000 1 | 0.622 10 | 0.535 13 | 0.343 13 | 0.483 3 | 0.230 14 | 0.943 11 | 0.289 11 | 0.618 8 | 0.596 6 | 0.140 9 | 0.679 9 | 0.000 1 | 0.022 6 | 0.783 12 | 0.620 13 | 0.906 2 | 0.000 1 | 0.806 9 | 0.137 11 | 0.865 6 | 0.000 1 | 0.378 12 | 0.000 16 | 0.168 16 | 0.680 9 | 0.227 14 | |||||||||||||||||||||||||||||
| Peng-Shuai Wang: OctFormer: Octree-based Transformers for 3D Point Clouds. SIGGRAPH 2023 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| OA-CNN-L_ScanNet200 | 0.333 12 | 0.558 6 | 0.269 10 | 0.124 14 | 0.448 15 | 0.080 10 | 0.272 6 | 0.000 3 | 0.000 8 | 0.000 1 | 0.342 9 | 0.515 4 | 0.524 8 | 0.713 14 | 0.789 10 | 0.158 12 | 0.384 13 | 0.000 3 | 0.806 7 | 0.125 8 | 0.000 10 | 0.496 9 | 0.332 7 | 0.498 15 | 0.227 9 | 0.024 7 | 0.474 3 | 0.000 1 | 0.003 2 | 0.071 10 | 0.487 4 | 0.000 12 | 0.000 1 | 0.110 9 | 0.000 3 | 0.876 8 | 0.013 18 | 0.703 4 | 0.000 8 | 0.076 10 | 0.473 13 | 0.355 12 | 0.906 7 | 0.000 1 | 0.000 2 | 0.476 6 | 0.706 1 | 0.000 10 | 0.672 11 | 0.835 14 | 0.748 10 | 0.015 13 | 0.223 8 | 0.860 12 | 0.000 1 | 0.000 11 | 0.572 8 | 0.000 7 | 0.509 7 | 0.313 8 | 0.662 5 | 0.398 14 | 0.396 8 | 0.411 14 | 0.276 2 | 0.527 5 | 0.711 6 | 0.000 7 | 0.076 14 | 0.946 7 | 0.166 6 | 0.000 1 | 0.022 11 | 0.160 7 | 0.183 14 | 0.493 14 | 0.699 10 | 0.637 7 | 0.403 7 | 0.330 13 | 0.406 14 | 0.526 7 | 0.024 2 | 0.000 1 | 0.392 12 | 0.000 12 | 0.016 16 | 0.000 13 | 0.196 4 | 0.915 6 | 0.112 12 | 0.557 11 | 0.197 7 | 0.352 11 | 0.877 4 | 0.000 13 | 0.000 1 | 0.592 13 | 0.103 11 | 0.000 14 | 0.067 1 | 0.000 1 | 0.089 8 | 0.735 8 | 0.625 12 | 0.130 10 | 0.568 7 | 0.836 8 | 0.271 9 | 0.534 10 | 0.043 14 | 0.799 12 | 0.001 5 | 0.445 6 | 0.000 1 | 0.000 8 | 0.024 2 | 0.661 5 | 0.000 5 | 0.262 3 | 0.000 1 | 0.591 9 | 0.517 14 | 0.373 9 | 0.788 7 | 0.021 9 | 0.000 1 | 0.455 5 | 0.517 10 | 0.320 9 | 0.823 13 | 0.200 17 | 0.001 18 | 0.150 6 | 0.100 13 | 0.000 1 | 0.736 10 | 0.668 11 | 0.103 15 | 0.052 7 | 0.662 5 | 0.720 9 | 0.000 1 | 0.602 6 | 0.112 7 | 0.002 6 | 0.000 1 | 0.637 10 | 0.000 2 | 0.000 1 | 0.621 11 | 0.569 6 | 0.398 10 | 0.412 5 | 0.234 13 | 0.949 7 | 0.363 6 | 0.492 15 | 0.495 12 | 0.251 4 | 0.665 10 | 0.000 1 | 0.001 11 | 0.805 8 | 0.833 7 | 0.794 12 | 0.000 1 | 0.821 6 | 0.314 5 | 0.843 12 | 0.000 1 | 0.560 10 | 0.245 8 | 0.262 7 | 0.713 5 | 0.370 11 | |||||||||||||||||||||||||||||
| GSTran | 0.334 11 | 0.533 13 | 0.250 13 | 0.179 9 | 0.487 9 | 0.041 17 | 0.139 14 | 0.003 1 | 0.273 6 | 0.000 1 | 0.273 17 | 0.189 17 | 0.465 13 | 0.704 15 | 0.794 9 | 0.198 8 | 0.831 6 | 0.000 3 | 0.712 9 | 0.055 17 | 0.063 6 | 0.518 7 | 0.306 9 | 0.459 17 | 0.217 11 | 0.028 5 | 0.282 15 | 0.000 1 | 0.000 3 | 0.044 13 | 0.405 12 | 0.558 9 | 0.000 1 | 0.080 13 | 0.000 3 | 0.873 10 | 0.020 17 | 0.684 8 | 0.000 8 | 0.075 13 | 0.496 10 | 0.363 10 | 0.651 16 | 0.000 1 | 0.000 2 | 0.425 9 | 0.648 6 | 0.000 10 | 0.669 12 | 0.914 7 | 0.741 11 | 0.009 15 | 0.200 10 | 0.864 10 | 0.000 1 | 0.000 11 | 0.560 10 | 0.000 7 | 0.357 15 | 0.233 13 | 0.633 12 | 0.408 12 | 0.411 4 | 0.320 17 | 0.242 5 | 0.440 10 | 0.598 15 | 0.047 4 | 0.205 9 | 0.940 11 | 0.139 12 | 0.000 1 | 0.372 5 | 0.138 9 | 0.191 11 | 0.495 12 | 0.618 14 | 0.624 10 | 0.321 13 | 0.595 4 | 0.496 7 | 0.499 9 | 0.000 4 | 0.000 1 | 0.340 13 | 0.014 7 | 0.032 7 | 0.136 5 | 0.000 5 | 0.903 9 | 0.279 5 | 0.601 10 | 0.198 6 | 0.345 12 | 0.849 12 | 0.260 7 | 0.000 1 | 0.573 15 | 0.072 17 | 0.060 5 | 0.000 4 | 0.000 1 | 0.089 8 | 0.838 5 | 0.775 4 | 0.125 12 | 0.381 12 | 0.752 14 | 0.274 6 | 0.517 14 | 0.032 16 | 0.841 6 | 0.000 6 | 0.354 15 | 0.000 1 | 0.047 6 | 0.000 3 | 0.439 14 | 0.787 3 | 0.252 4 | 0.000 1 | 0.512 17 | 0.507 17 | 0.158 17 | 0.717 12 | 0.000 11 | 0.000 1 | 0.337 13 | 0.483 14 | 0.570 2 | 0.853 9 | 0.614 8 | 0.121 12 | 0.070 10 | 0.229 8 | 0.000 1 | 0.732 12 | 0.773 2 | 0.193 3 | 0.000 11 | 0.606 8 | 0.791 6 | 0.000 1 | 0.593 9 | 0.000 15 | 0.010 5 | 0.000 1 | 0.574 17 | 0.000 2 | 0.000 1 | 0.507 13 | 0.554 10 | 0.361 12 | 0.136 14 | 0.608 4 | 0.948 8 | 0.304 9 | 0.593 11 | 0.533 9 | 0.011 17 | 0.634 13 | 0.000 1 | 0.060 3 | 0.821 5 | 0.613 14 | 0.797 11 | 0.000 1 | 0.799 12 | 0.036 14 | 0.782 15 | 0.000 1 | 0.609 7 | 0.423 4 | 0.133 18 | 0.647 13 | 0.213 16 | |||||||||||||||||||||||||||||
| IMFSegNet | 0.334 10 | 0.532 14 | 0.251 12 | 0.179 8 | 0.486 10 | 0.041 17 | 0.139 14 | 0.003 1 | 0.283 5 | 0.000 1 | 0.274 16 | 0.191 16 | 0.457 15 | 0.704 15 | 0.795 7 | 0.197 9 | 0.830 7 | 0.000 3 | 0.710 10 | 0.055 17 | 0.064 5 | 0.518 7 | 0.305 10 | 0.458 18 | 0.216 13 | 0.027 6 | 0.284 14 | 0.000 1 | 0.000 3 | 0.044 13 | 0.406 11 | 0.561 8 | 0.000 1 | 0.080 13 | 0.000 3 | 0.873 10 | 0.021 16 | 0.683 9 | 0.000 8 | 0.076 10 | 0.494 11 | 0.363 10 | 0.648 17 | 0.000 1 | 0.000 2 | 0.425 9 | 0.649 5 | 0.000 10 | 0.668 13 | 0.908 8 | 0.740 12 | 0.010 14 | 0.206 9 | 0.862 11 | 0.000 1 | 0.000 11 | 0.560 10 | 0.000 7 | 0.359 14 | 0.237 12 | 0.631 13 | 0.408 12 | 0.411 4 | 0.322 16 | 0.246 4 | 0.439 11 | 0.599 14 | 0.047 4 | 0.213 8 | 0.940 11 | 0.139 12 | 0.000 1 | 0.369 6 | 0.124 10 | 0.188 13 | 0.495 12 | 0.624 12 | 0.626 9 | 0.320 15 | 0.595 4 | 0.495 8 | 0.496 11 | 0.000 4 | 0.000 1 | 0.340 13 | 0.014 7 | 0.032 7 | 0.135 6 | 0.000 5 | 0.903 9 | 0.277 6 | 0.612 9 | 0.196 8 | 0.344 13 | 0.848 14 | 0.260 7 | 0.000 1 | 0.574 14 | 0.073 16 | 0.062 4 | 0.000 4 | 0.000 1 | 0.091 7 | 0.839 4 | 0.776 3 | 0.123 13 | 0.392 10 | 0.756 13 | 0.274 6 | 0.518 13 | 0.029 17 | 0.842 5 | 0.000 6 | 0.357 14 | 0.000 1 | 0.035 7 | 0.000 3 | 0.444 13 | 0.793 2 | 0.245 5 | 0.000 1 | 0.512 17 | 0.512 16 | 0.159 16 | 0.713 13 | 0.000 11 | 0.000 1 | 0.336 14 | 0.484 13 | 0.569 3 | 0.852 10 | 0.615 7 | 0.120 13 | 0.068 11 | 0.228 9 | 0.000 1 | 0.733 11 | 0.773 2 | 0.190 4 | 0.000 11 | 0.608 7 | 0.792 5 | 0.000 1 | 0.597 7 | 0.000 15 | 0.025 2 | 0.000 1 | 0.573 18 | 0.000 2 | 0.000 1 | 0.508 12 | 0.555 9 | 0.363 11 | 0.139 13 | 0.610 3 | 0.947 9 | 0.305 8 | 0.594 10 | 0.527 10 | 0.009 18 | 0.633 14 | 0.000 1 | 0.060 3 | 0.820 6 | 0.604 16 | 0.799 10 | 0.000 1 | 0.799 12 | 0.034 15 | 0.784 14 | 0.000 1 | 0.618 6 | 0.424 3 | 0.134 17 | 0.646 14 | 0.214 15 | |||||||||||||||||||||||||||||
| PonderV2 ScanNet200 | 0.346 7 | 0.552 9 | 0.270 9 | 0.175 10 | 0.497 8 | 0.070 13 | 0.239 8 | 0.000 3 | 0.000 8 | 0.000 1 | 0.232 18 | 0.412 9 | 0.584 3 | 0.842 4 | 0.804 5 | 0.212 7 | 0.540 11 | 0.000 3 | 0.433 17 | 0.106 11 | 0.000 10 | 0.590 6 | 0.290 12 | 0.548 6 | 0.243 7 | 0.000 10 | 0.356 12 | 0.000 1 | 0.000 3 | 0.062 11 | 0.398 14 | 0.441 11 | 0.000 1 | 0.104 11 | 0.000 3 | 0.888 6 | 0.076 12 | 0.682 10 | 0.030 4 | 0.094 7 | 0.491 12 | 0.351 13 | 0.869 11 | 0.000 1 | 0.063 1 | 0.403 12 | 0.700 2 | 0.000 10 | 0.660 14 | 0.881 10 | 0.761 4 | 0.050 8 | 0.186 11 | 0.852 14 | 0.000 1 | 0.007 9 | 0.570 9 | 0.100 2 | 0.565 3 | 0.326 7 | 0.641 11 | 0.431 7 | 0.290 15 | 0.621 6 | 0.259 3 | 0.408 12 | 0.622 11 | 0.125 2 | 0.082 13 | 0.950 6 | 0.179 5 | 0.000 1 | 0.263 7 | 0.424 5 | 0.193 10 | 0.558 8 | 0.880 4 | 0.545 14 | 0.375 8 | 0.727 3 | 0.445 13 | 0.499 9 | 0.000 4 | 0.000 1 | 0.475 8 | 0.002 10 | 0.034 6 | 0.083 9 | 0.000 5 | 0.924 3 | 0.290 4 | 0.636 6 | 0.115 15 | 0.400 6 | 0.874 5 | 0.186 11 | 0.000 1 | 0.611 9 | 0.128 3 | 0.113 2 | 0.000 4 | 0.000 1 | 0.000 12 | 0.584 13 | 0.636 10 | 0.103 15 | 0.385 11 | 0.843 7 | 0.283 5 | 0.603 7 | 0.080 8 | 0.825 11 | 0.000 6 | 0.377 11 | 0.000 1 | 0.000 8 | 0.000 3 | 0.457 12 | 0.000 5 | 0.000 9 | 0.000 1 | 0.574 13 | 0.608 10 | 0.481 4 | 0.792 5 | 0.394 6 | 0.000 1 | 0.357 11 | 0.503 12 | 0.261 11 | 0.817 14 | 0.504 13 | 0.304 8 | 0.472 5 | 0.115 12 | 0.000 1 | 0.750 8 | 0.677 10 | 0.202 2 | 0.000 11 | 0.509 10 | 0.729 7 | 0.000 1 | 0.519 13 | 0.000 15 | 0.000 7 | 0.000 1 | 0.620 13 | 0.000 2 | 0.000 1 | 0.660 7 | 0.560 8 | 0.486 7 | 0.384 6 | 0.346 11 | 0.952 6 | 0.247 15 | 0.667 5 | 0.436 13 | 0.269 3 | 0.691 7 | 0.000 1 | 0.010 7 | 0.787 11 | 0.889 3 | 0.880 5 | 0.000 1 | 0.810 8 | 0.336 4 | 0.860 9 | 0.000 1 | 0.606 8 | 0.009 12 | 0.248 10 | 0.681 8 | 0.392 9 | |||||||||||||||||||||||||||||
| Haoyi Zhu, Honghui Yang, Xiaoyang Wu, Di Huang, Sha Zhang, Xianglong He, Tong He, Hengshuang Zhao, Chunhua Shen, Yu Qiao, Wanli Ouyang: PonderV2: Pave the Way for 3D Foundataion Model with A Universal Pre-training Paradigm. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| BFANet ScanNet200 | 0.360 6 | 0.553 8 | 0.293 6 | 0.193 6 | 0.483 11 | 0.096 7 | 0.266 7 | 0.000 3 | 0.000 8 | 0.000 1 | 0.298 14 | 0.255 13 | 0.661 1 | 0.810 6 | 0.810 3 | 0.194 10 | 0.785 8 | 0.000 3 | 0.000 18 | 0.161 7 | 0.000 10 | 0.494 10 | 0.382 3 | 0.574 4 | 0.258 5 | 0.000 10 | 0.372 10 | 0.000 1 | 0.000 3 | 0.043 15 | 0.436 9 | 0.000 12 | 0.000 1 | 0.239 3 | 0.000 3 | 0.901 3 | 0.105 1 | 0.689 5 | 0.025 5 | 0.128 4 | 0.614 3 | 0.436 2 | 0.493 18 | 0.000 1 | 0.000 2 | 0.526 4 | 0.546 14 | 0.109 5 | 0.651 15 | 0.953 6 | 0.753 7 | 0.101 5 | 0.143 14 | 0.897 6 | 0.000 1 | 0.431 1 | 0.469 16 | 0.000 7 | 0.522 6 | 0.337 6 | 0.661 7 | 0.459 4 | 0.409 6 | 0.666 5 | 0.102 14 | 0.508 7 | 0.757 5 | 0.000 7 | 0.060 15 | 0.970 3 | 0.497 1 | 0.000 1 | 0.376 4 | 0.511 3 | 0.262 5 | 0.688 3 | 0.921 2 | 0.617 11 | 0.321 13 | 0.590 6 | 0.491 9 | 0.556 5 | 0.000 4 | 0.000 1 | 0.481 6 | 0.093 1 | 0.043 3 | 0.284 2 | 0.000 5 | 0.875 15 | 0.135 9 | 0.669 4 | 0.124 14 | 0.394 7 | 0.849 12 | 0.298 5 | 0.000 1 | 0.476 18 | 0.088 13 | 0.042 7 | 0.000 4 | 0.000 1 | 0.254 5 | 0.653 11 | 0.741 6 | 0.215 1 | 0.573 6 | 0.852 6 | 0.266 11 | 0.654 3 | 0.056 13 | 0.835 7 | 0.000 6 | 0.492 2 | 0.000 1 | 0.000 8 | 0.000 3 | 0.612 10 | 0.000 5 | 0.000 9 | 0.000 1 | 0.616 7 | 0.469 18 | 0.460 5 | 0.698 14 | 0.516 3 | 0.000 1 | 0.378 9 | 0.563 5 | 0.476 5 | 0.863 6 | 0.574 10 | 0.330 7 | 0.000 12 | 0.282 3 | 0.000 1 | 0.760 5 | 0.710 6 | 0.233 1 | 0.000 11 | 0.641 6 | 0.814 3 | 0.000 1 | 0.585 10 | 0.053 12 | 0.000 7 | 0.000 1 | 0.629 11 | 0.000 2 | 0.000 1 | 0.678 4 | 0.528 14 | 0.534 6 | 0.129 15 | 0.596 5 | 0.973 5 | 0.264 13 | 0.772 2 | 0.526 11 | 0.139 10 | 0.707 5 | 0.000 1 | 0.000 12 | 0.764 15 | 0.591 17 | 0.848 7 | 0.000 1 | 0.827 5 | 0.338 3 | 0.806 13 | 0.000 1 | 0.568 9 | 0.151 11 | 0.358 2 | 0.659 11 | 0.510 4 | |||||||||||||||||||||||||||||
| Weiguang Zhao, Rui Zhang, Qiufeng Wang, Guangliang Cheng, Kaizhu Huang: BFANet: Revisiting 3D Semantic Segmentation with Boundary Feature Analysis. CVPR 2025 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Minkowski 34D | 0.253 17 | 0.463 17 | 0.154 18 | 0.102 17 | 0.381 17 | 0.084 9 | 0.134 16 | 0.000 3 | 0.000 8 | 0.000 1 | 0.386 7 | 0.141 18 | 0.279 18 | 0.737 13 | 0.703 17 | 0.014 18 | 0.164 16 | 0.000 3 | 0.663 11 | 0.092 15 | 0.000 10 | 0.224 16 | 0.291 11 | 0.531 9 | 0.056 18 | 0.000 10 | 0.242 17 | 0.000 1 | 0.000 3 | 0.013 16 | 0.331 17 | 0.000 12 | 0.000 1 | 0.035 18 | 0.001 2 | 0.858 15 | 0.059 15 | 0.650 17 | 0.000 8 | 0.056 15 | 0.353 16 | 0.299 16 | 0.670 14 | 0.000 1 | 0.000 2 | 0.284 17 | 0.484 16 | 0.071 8 | 0.594 16 | 0.720 17 | 0.710 16 | 0.027 11 | 0.068 18 | 0.813 15 | 0.000 1 | 0.005 10 | 0.492 15 | 0.164 1 | 0.274 17 | 0.111 17 | 0.571 17 | 0.307 18 | 0.293 14 | 0.307 18 | 0.150 9 | 0.163 18 | 0.531 17 | 0.002 6 | 0.545 5 | 0.932 16 | 0.093 18 | 0.000 1 | 0.000 13 | 0.002 14 | 0.159 16 | 0.368 18 | 0.581 16 | 0.440 18 | 0.228 18 | 0.406 10 | 0.282 18 | 0.294 17 | 0.000 4 | 0.000 1 | 0.189 17 | 0.060 2 | 0.036 5 | 0.000 13 | 0.000 5 | 0.897 12 | 0.000 18 | 0.525 15 | 0.025 18 | 0.205 18 | 0.771 18 | 0.000 13 | 0.000 1 | 0.593 12 | 0.108 9 | 0.044 6 | 0.000 4 | 0.000 1 | 0.000 12 | 0.282 18 | 0.589 15 | 0.094 17 | 0.169 17 | 0.466 18 | 0.227 17 | 0.419 18 | 0.125 5 | 0.757 15 | 0.002 4 | 0.334 17 | 0.000 1 | 0.000 8 | 0.000 3 | 0.357 16 | 0.000 5 | 0.000 9 | 0.000 1 | 0.582 11 | 0.513 15 | 0.337 11 | 0.612 18 | 0.000 11 | 0.000 1 | 0.250 17 | 0.352 18 | 0.136 18 | 0.724 17 | 0.655 5 | 0.280 9 | 0.000 12 | 0.046 17 | 0.000 1 | 0.606 18 | 0.559 16 | 0.159 7 | 0.102 3 | 0.445 11 | 0.655 10 | 0.000 1 | 0.310 18 | 0.117 6 | 0.000 7 | 0.000 1 | 0.581 16 | 0.026 1 | 0.000 1 | 0.265 18 | 0.483 17 | 0.084 18 | 0.097 18 | 0.044 16 | 0.865 18 | 0.142 18 | 0.588 12 | 0.351 16 | 0.272 2 | 0.596 18 | 0.000 1 | 0.003 10 | 0.622 17 | 0.720 11 | 0.096 18 | 0.000 1 | 0.771 17 | 0.016 16 | 0.772 16 | 0.000 1 | 0.302 15 | 0.194 10 | 0.214 13 | 0.621 17 | 0.197 17 | |||||||||||||||||||||||||||||
| C. Choy, J. Gwak, S. Savarese: 4D Spatio-Temporal ConvNets: Minkowski Convolutional Neural Networks. CVPR 2019 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ODIN - Sem200 | 0.368 5 | 0.562 5 | 0.297 5 | 0.207 5 | 0.380 18 | 0.196 1 | 0.828 3 | 0.000 3 | 0.321 3 | 0.000 1 | 0.400 5 | 0.775 1 | 0.460 14 | 0.501 18 | 0.769 13 | 0.065 16 | 0.870 4 | 0.000 3 | 0.913 1 | 0.213 4 | 0.000 10 | 0.000 18 | 0.389 2 | 0.554 5 | 0.312 3 | 0.000 10 | 0.591 1 | 0.000 1 | 0.000 3 | 0.491 1 | 0.487 4 | 0.894 2 | 0.000 1 | 0.378 2 | 0.303 1 | 0.796 18 | 0.088 6 | 0.669 14 | 0.081 2 | 0.216 1 | 0.256 18 | 0.334 14 | 0.898 8 | 0.000 1 | 0.000 2 | 0.370 15 | 0.599 11 | 0.000 10 | 0.581 17 | 0.988 2 | 0.749 9 | 0.090 6 | 0.242 6 | 0.921 4 | 0.000 1 | 0.202 5 | 0.609 3 | 0.000 7 | 0.655 1 | 0.214 14 | 0.654 10 | 0.346 16 | 0.408 7 | 0.485 9 | 0.169 8 | 0.631 2 | 0.704 7 | 0.000 7 | 0.814 1 | 0.940 11 | 0.127 17 | 0.000 1 | 0.000 13 | 0.462 4 | 0.227 7 | 0.641 5 | 0.885 3 | 0.657 6 | 0.434 3 | 0.000 18 | 0.550 2 | 0.393 16 | 0.000 4 | 0.000 1 | 0.590 4 | 0.000 12 | 0.048 2 | 0.077 10 | 0.000 5 | 0.784 17 | 0.131 10 | 0.557 11 | 0.316 2 | 0.359 9 | 0.833 15 | 0.373 3 | 0.000 1 | 0.661 4 | 0.108 9 | 0.001 12 | 0.000 4 | 0.000 1 | 0.301 4 | 0.612 12 | 0.565 16 | 0.129 11 | 0.482 9 | 0.468 17 | 0.274 6 | 0.561 9 | 0.376 1 | 0.912 2 | 0.181 1 | 0.440 7 | 0.000 1 | 0.166 4 | 0.000 3 | 0.641 6 | 0.000 5 | 0.426 2 | 0.000 1 | 0.642 6 | 0.626 8 | 0.259 12 | 0.787 8 | 0.429 5 | 0.000 1 | 0.589 1 | 0.523 9 | 0.246 12 | 0.857 7 | 0.000 18 | 0.228 10 | 0.000 12 | 0.265 4 | 0.000 1 | 0.752 7 | 0.832 1 | 0.090 17 | 0.157 1 | 0.791 2 | 0.578 17 | 0.000 1 | 0.373 16 | 0.539 1 | 0.000 7 | 0.000 1 | 0.685 5 | 0.000 2 | 0.000 1 | 0.632 9 | 0.575 4 | 0.663 1 | 0.152 12 | 0.358 10 | 0.926 14 | 0.397 4 | 0.454 16 | 0.610 5 | 0.119 16 | 0.685 8 | 0.000 1 | 0.000 12 | 0.803 9 | 0.740 10 | 0.441 15 | 0.000 1 | 0.800 11 | 0.000 18 | 0.871 4 | 0.000 1 | 0.220 18 | 0.487 2 | 0.862 1 | 0.682 7 | 0.054 18 | |||||||||||||||||||||||||||||
| Ayush Jain, Pushkal Katara, Nikolaos Gkanatsios, Adam W. Harley, Gabriel Sarch, Kriti Aggarwal, Vishrav Chaudhary, Katerina Fragkiadaki: ODIN: A Single Model for 2D and 3D Segmentation. CVPR 2024 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| CSC-Pretrain | 0.249 18 | 0.455 18 | 0.171 17 | 0.079 18 | 0.418 16 | 0.059 15 | 0.186 11 | 0.000 3 | 0.000 8 | 0.000 1 | 0.335 11 | 0.250 14 | 0.316 17 | 0.766 8 | 0.697 18 | 0.142 14 | 0.170 15 | 0.003 2 | 0.553 15 | 0.112 10 | 0.097 1 | 0.201 17 | 0.186 15 | 0.476 16 | 0.081 17 | 0.000 10 | 0.216 18 | 0.000 1 | 0.000 3 | 0.001 18 | 0.314 18 | 0.000 12 | 0.000 1 | 0.055 16 | 0.000 3 | 0.832 17 | 0.094 3 | 0.659 16 | 0.002 6 | 0.076 10 | 0.310 17 | 0.293 18 | 0.664 15 | 0.000 1 | 0.000 2 | 0.175 18 | 0.634 7 | 0.130 2 | 0.552 18 | 0.686 18 | 0.700 18 | 0.076 7 | 0.110 16 | 0.770 18 | 0.000 1 | 0.000 11 | 0.430 18 | 0.000 7 | 0.319 16 | 0.166 16 | 0.542 18 | 0.327 17 | 0.205 17 | 0.332 15 | 0.052 16 | 0.375 14 | 0.444 18 | 0.000 7 | 0.012 18 | 0.930 18 | 0.203 3 | 0.000 1 | 0.000 13 | 0.046 12 | 0.175 15 | 0.413 17 | 0.592 15 | 0.471 17 | 0.299 16 | 0.152 17 | 0.340 17 | 0.247 18 | 0.000 4 | 0.000 1 | 0.225 16 | 0.058 3 | 0.037 4 | 0.000 13 | 0.207 3 | 0.862 16 | 0.014 14 | 0.548 14 | 0.033 17 | 0.233 17 | 0.816 17 | 0.000 13 | 0.000 1 | 0.542 16 | 0.123 5 | 0.121 1 | 0.019 2 | 0.000 1 | 0.000 12 | 0.463 17 | 0.454 18 | 0.045 18 | 0.128 18 | 0.557 16 | 0.235 15 | 0.441 17 | 0.063 11 | 0.484 18 | 0.000 6 | 0.308 18 | 0.000 1 | 0.000 8 | 0.000 3 | 0.318 18 | 0.000 5 | 0.000 9 | 0.000 1 | 0.545 15 | 0.543 13 | 0.164 15 | 0.734 9 | 0.000 11 | 0.000 1 | 0.215 18 | 0.371 17 | 0.198 15 | 0.743 15 | 0.205 16 | 0.062 16 | 0.000 12 | 0.079 15 | 0.000 1 | 0.683 17 | 0.547 17 | 0.142 9 | 0.000 11 | 0.441 12 | 0.579 16 | 0.000 1 | 0.464 15 | 0.098 9 | 0.041 1 | 0.000 1 | 0.590 15 | 0.000 2 | 0.000 1 | 0.373 14 | 0.494 15 | 0.174 16 | 0.105 17 | 0.001 18 | 0.895 17 | 0.222 17 | 0.537 13 | 0.307 17 | 0.180 5 | 0.625 15 | 0.000 1 | 0.000 12 | 0.591 18 | 0.609 15 | 0.398 16 | 0.000 1 | 0.766 18 | 0.014 17 | 0.638 18 | 0.000 1 | 0.377 13 | 0.004 14 | 0.206 14 | 0.609 18 | 0.465 5 | |||||||||||||||||||||||||||||
| Ji Hou, Benjamin Graham, Matthias Nießner, Saining Xie: Exploring Data-Efficient 3D Scene Understanding with Contrastive Scene Contexts. CVPR 2021 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
